Am 25.01.2014 02:06, schrieb Robert Kehl:
...

Gefordert ist eine Lösung, mit der bestehende PDFs geändert werden
können wie es mit Adobe Acrobat möglich ist...

Ist ein grosses Thema, auch im aktuellen Linux Magazin 2/14, wo die PDF-Interoperabilität von Inkscape, LibreOffice Draw/Writer, Scribus mit Indesign getestet werden, und zudem einige Kommandozeilen Tools, um wahlweise Text, Bilder oder Schriftsätze zu extrahieren.

Der Test deckt sich mit meinen Erfahrungen:

"Übliches" PDF aus Text mit Bitmap-Bildern geht befriedigend bis gut in LibreOffice Draw, bringt aber viel Arbeit ausser bei kleinen Änderungen, da alles zeilenweise.

PDF aus Text mit Vektor-Bildern geht gut mit Inkscape, jedoch nur seitenweise und nur zum Extrahieren der Vektor-Bilder. (Die Texte sind auch vektorisiert und fast uneditierbar, dafür beliebig verformbar.)

Im Artikel wird darauf hingewiesen, dass es oft Probleme mit den Schriftsätzen gibt, die oft nicht vollständig (oder gar nicht) eingebettet sind.

Ein anderer Ansatz ist ein OCR-Programm zu verwenden. Eine FLOSS-Lösung habe ich nie probiert, aber eine frühe Version von Abby (oder so) Finereader unter Wine. Hier ist es auch egal, wenn das PDF selbst nur ein eingebettetes Bild ist. Das OCR-Programm erzeugt ein DOC mit demselben Layout. Allerdings ist das Layout fast nicht veränderbar, ohne es zu zerstören. Vermutlich gibt es heute gute solche Lösungen, auch FLOSS, da ein grosses Thema beim platzsparenden Speichern von Dokumenten. Ich habe auf einer FLOSS-Messe mal ein solches automatisiertes System gesehen.

Es gibt komplizierte Ghostview-Befehle, um die Auflösungen und/oder Farbräume von Bitmaps in PDFs zu reduzieren und/oder die Kompression zu erhöhen. Das geht sehr gut. Kann ich angeben.

Viele Grüsse,
Theo


_______________________________________________
fsfe-de mailing list
fsfe-de@fsfeurope.org
https://mail.fsfeurope.org/mailman/listinfo/fsfe-de

Reply via email to