Hallo Matthias,

Am Mon, 06 Jan 2020 12:18:49 +0100
schrieb Matthias Müller Posteo.de <matth_mueller_...@posteo.de>:
 
> Das ist der Punkt. Die Textdaten müssen extrahiert werden, 

Nach Allem, was ich gelesen habe und auch hier diskutiert wurde, läuft
es (bis auf eine Ausnahme) wohl darauf hinaus - und das ufert leicht
aus. 

> was einigermaßen komfortabel nur für ODT-Daten funktioniert und auch
> nur hier automatisiert werden kann. 

Wobei mir nicht klar ist, wie dieser Schritt zzgl. die
Rückkonvertierung ins odt-Format für viele Dateien in einem Rutsch
möglich wäre (ich vermute: gar nicht).

> Das ist vermutlich der einfachere Teil des Workflows. Word-Daten sind
> komplett binär, das ist nix mit automatisch den Textteil extrahieren.
> Erst nach dem Extrahieren ist es möglich mit einem Tool wie recode oä
> zu konvertieren.
> 
> Ab hier wird es beliebig komplex.....
> 
Eben. Ich aber kann mir solch einen Aufwand nicht ans Bein binden.

> Diese Ausführlichkeit, hat einen einfachen Grund: Ich habe schon mit
> solch einem Problem gekämpft und dann frustriert aufgegeben. Und das
> waren bereits Textdaten, die allerdings von Windows nach Linux
> transferiert wurden.
> 
Au weia...

> Falls du es doch versuchen willst, läuft das ganze auf Scripten raus. 
> Werkzeuge mit denen du dann arbeiten müsstest wären
> "gzip" / "gunzip" um die SO-/LO-Daten zu entpacken
> "find" um sie zu finden und sie dann mit 
> "mv" oder "cp" zu verschieben oder kopieren
> Für das Ersetzen der seltsamen (eigentlich regulären Unicode-)
> Zeichen kommen diverse Werkzeuge in Frage: "tr", "sed", "recode" und
> wahrscheinlich noch ein paar.
> 
s.o.: Scheitert am Aufwand. Der muss in Grenzen bleiben.

> Aus meiner Sicht die einfachste Methode, allerdings auch die mit dem
> meisten Stumpsinn (und deshalb durchaus fehleranfäälig):
> Mit LO öffnen und über Suchen/ersetzen (eventl mit RegEx-Hilfe) die
> Dateien einzeln zu bearbeiten. 

Ja, ist wohl die (handwerklich) einfachste, aber eben auch sehr
aufwändig, weil jede einzelne Datei bearbeitet werden muss. Insofern
scheint sich mit der hier vorgeschlagenem (und von mir als bereits
angewandt entdeckten) Makro-Variante das Ganze noch etwas komfortabler
zu gestalten. Offenbar gibt es kein Mittel, solch ein Makro über viele
Dateien auf einmal zu jagen.

Hilfreich wäre nun für mich ein Tipp, wie ich das vorhandene Makro um
weitere Zeichen aufstocke. Gibt es in der entsprechenden Maske dafür
Schalter, Buttons, o.ä.?

> Danach sofort als PDF/A exportieren. PDF/A deshalb, weil es ein
> ISO-genormtes Archivformat ist, siehe
> https://de.wikipedia.org/wiki/PDF/A
> 
Exportiert LO denn nicht in PDF/A?

Viele Grüße

Rainer

-- 
Liste abmelden mit E-Mail an: users+unsubscr...@de.libreoffice.org
Probleme? 
https://de.libreoffice.org/hilfe-kontakt/mailing-listen/abmeldung-liste/
Tipps zu Listenmails: https://wiki.documentfoundation.org/Netiquette/de
Listenarchiv: https://listarchives.libreoffice.org/de/users/
Datenschutzerklärung: https://www.documentfoundation.org/privacy

Antwort per Email an