Hallo Ulrich,

die Quelle ist ein altes Buch, in dem erzwungener Blocksatz gesetzt worden ist.

da kann das OCR-Programm nicht erkennen, ob das Leezeichen vor dem Wort oder in dem Wort ist.

mit freundlichem Gruss

Martin

Am 03.07.2019 um 11:02 schrieb Ulrich Moser:
Hallo Martin,

das sehe ich auch so, es sei denn du wärest in der Lage die Korrektur
mit einer Rechtschreibprüfung zu koppeln. Das führt aber meines
Erachtens für eine reine Makroprogrammierung zu weit.. Die Frage ist ja
auch, wo kommen die fehlerhaften Texte her. Kann man da nicht an der
Quelle bereits ansetzen.

Viel Erfolg!

Ulrich

Am 03.07.19 um 10:48 schrieb Fritz Szekät:
Hallo Martin,

Am 03.07.2019 um 07:36 schrieb Martin Jenniges:

Nun habe ich einen Buchtext, der einen erzwungenen Blocksaatz
aufweist. Beim OCR kommen daher viele Wörter mit Leerzeichen drin
vor; diese Leerzeichen muss ich jetzt händisch entfernen.
ich befürchte - da die Leerzeichen in Worten vorkommen - dass da ohne
händisch gar nichts geht, weil:
Das Makro nicht wissen kann, ob es sich um einen reellen Leerraum oder
ein falschen Leerzeichen in einem Wort handelt.



--
Liste abmelden mit E-Mail an: users+unsubscr...@de.libreoffice.org
Probleme? 
https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/users/
Datenschutzerklärung: https://www.documentfoundation.org/privacy

Antwort per Email an