Am 22.10.20 um 16:38 schrieb Henning Thielemann: > > On Thu, 22 Oct 2020, Roland Hummel wrote: > >> ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an >> OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde >> fragen: >> >> "Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus >> eingescannten Dokumenten >> >> a) Verzerrungen entfernt >> b) eine zuverlässige, mehrsprachige Texterkennung durchführt und >> c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht >> eingescannte Texte für einen Ausdruck vorbereitet werden können. > > ScanTailor und neuer ScanTailorAdvanced übernehmen a) und c). > > Übrigens nehme ich auch sehr gerne jbig2enc, um Schwarz-Weiß-Dokumente > anschließend sehr kompakt zum komprimieren. Auf die JBIG-Kompression bin ich > ausgerechnet durch David Kriesels Vortrag über einen schwerwiegenden Fehler > in der JBIG-Implementierung von XEROX gestoßen. Bei jbig2enc habe ich aber > noch keine Probleme beobachtet.
Zu b) verwende ich tesseract seit vielen Jahren. -- Michael Ebner _______________________________________________ FSFE-de mailing list FSFE-de@lists.fsfe.org https://lists.fsfe.org/mailman/listinfo/fsfe-de Diese Mailingliste wird durch den Verhaltenskodex der FSFE abgedeckt. Alle Teilnehmer werden gebeten, sich gegenseitig vorbildlich zu behandeln: https://fsfe.org/about/codeofconduct