Hallo, sofern die Scans als PDF vorliegen, ist OCRmyPDF [0] ein hübsches Tool. Es ist in Python(3) geschrieben und damit plattformunabhängig.
Es bettet einen "Textlayer" in das Dokument ein, sodass man anschließend Copy-and-Paste machen kann. Man kann sich auch den Text als solchen ausgeben bzw. in eine Datei schreiben lassen. Auch der Erhalt des Originaldokuments ist möglich. Auch dieses Tool nutzt tesseract. Allerdings ist es ein Konsolentool. Ich habe hierzu auch ein GUI (ebenfalls in Python3) geschrieben, allerdings, da noch nicht ganz fertig, noch nicht veröffentlicht. Der bisherige praktische Einsatz gab zu Klagen keinen Anlass. Mit freundlichem Gruß Michael (St.) [0] https://packages.debian.org/search?suite=all&searchon=names&keywords=ocrmypdf https://www.heise.de/download/product/ocrmypdf
signature.asc
Description: OpenPGP digital signature
_______________________________________________ FSFE-de mailing list [email protected] https://lists.fsfe.org/mailman/listinfo/fsfe-de Diese Mailingliste wird durch den Verhaltenskodex der FSFE abgedeckt. Alle Teilnehmer werden gebeten, sich gegenseitig vorbildlich zu behandeln: https://fsfe.org/about/codeofconduct
