Am 22.10.20 um 16:38 schrieb Henning Thielemann:
> 
> On Thu, 22 Oct 2020, Roland Hummel wrote:
> 
>> ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an 
>> OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde 
>> fragen:
>>
>> "Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
>> eingescannten Dokumenten
>>
>> a) Verzerrungen entfernt
>> b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
>> c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht 
>> eingescannte Texte für einen Ausdruck vorbereitet werden können.
> 
> ScanTailor und neuer ScanTailorAdvanced übernehmen a) und c).
> 
> Übrigens nehme ich auch sehr gerne jbig2enc, um Schwarz-Weiß-Dokumente 
> anschließend sehr kompakt zum komprimieren. Auf die JBIG-Kompression bin ich 
> ausgerechnet durch David Kriesels Vortrag über einen schwerwiegenden Fehler 
> in der JBIG-Implementierung von XEROX gestoßen. Bei jbig2enc habe ich aber 
> noch keine Probleme beobachtet.

Zu b) verwende ich tesseract seit vielen Jahren.

-- 
Michael Ebner

_______________________________________________
FSFE-de mailing list
FSFE-de@lists.fsfe.org
https://lists.fsfe.org/mailman/listinfo/fsfe-de

Diese Mailingliste wird durch den Verhaltenskodex der FSFE abgedeckt.
Alle Teilnehmer werden gebeten, sich gegenseitig vorbildlich zu
behandeln: https://fsfe.org/about/codeofconduct

Antwort per Email an