procmail und pdftotext
-BEGIN PGP SIGNED MESSAGE- Hash: SHA1 Hi, ich wuerde gerne PDF-Dateien (application/pdf) durch procmail via pdftotext automatisch in PlainText Dateien umwandeln, und diese als zusaetzliches Attachment an die entsprechende Nachricht dranhaengen. Ist das realisierbar? Wenn ja - Wie? - -- - - Rainer Bendig aka "Ny" | http://www.moins.de | GnuPG-Key 0x41D44F10 -BEGIN PGP SIGNATURE- Version: GnuPG v1.9.16-cvs (GNU/Linux) iD8DBQFCOT6YWmkXC0TkjEgRAqxEAJ0fHYbPVNbFcVGeySPLuB4giFqmMQCcCIbH Uv7Cu83KQDbJudj71H0JROU= =mFlk -END PGP SIGNATURE- -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)
Fwd: Re: pdftotext
>Ist es vielleicht möglich, dass Deine pdf-Datei den Text als Bild >enthält? Ich hatte auch mal ein Buch, bei dem pdftotext nur Hyroglyphen >ausspuckte. Ich merkte dann, dass in dem Buch nur die Überschriften als >Text hinterlegt waren, nicht aber der eigentliche Text. Probier mal, in >der PDF-Datei nach Wörtern zu suchen. Gegebenfalls dann durch eine >Texterkennung laufen lassen. Ich habe es gerade mit einem anderen pdf-Text versucht, und da klappt es. Also lag es an der Datei , und das nächste Mal weiss ich Bescheid. tschüs Klaus
Re: pdftotext
On Sunday 16 May 2004 23:58, Alfred Ostermeier wrote: [...] > Klaus Becker wrote: > >>>ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus > >>> dem Paket "xpdf-utils" kommen aber nur Hyroglyphen raus. > >>>Kennt sich da jemand aus ? > >> > >>Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei > >>mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten > >>Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht > >>viel besser. [...] > > pdftops hat mir die pdf-Datei in eine ordentliche ps-Datei verwandelt. > > Dann habe ich die ps-Datei mit ps2ascii behandelt, da kommt nur Schrott > > raus. Welche Option(-en) gibst du da an? [...] > Ist es vielleicht möglich, dass Deine pdf-Datei den Text als Bild > enthält? Ich hatte auch mal ein Buch, bei dem pdftotext nur Hyroglyphen > ausspuckte. Ich merkte dann, dass in dem Buch nur die Überschriften als > Text hinterlegt waren, nicht aber der eigentliche Text. Probier mal, in > der PDF-Datei nach Wörtern zu suchen. Gegebenfalls dann durch eine > Texterkennung laufen lassen. [...] Versuch das PDF Dokument einmal in KOffice zu öffnen. Damit sollte am schnellsten zu sehen sein ob es sich um Text oder nur um Bilder handelt. Tschüss, Thomas
Re: pdftotext
Hallo! Klaus Becker wrote: >>>ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem >>>Paket "xpdf-utils" kommen aber nur Hyroglyphen raus. >>>Kennt sich da jemand aus ? >> >>Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei >>mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten >>Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht >>viel besser. >> >>Gruss, >>Eduard. > > > Hallo Eduard, > > pdftops hat mir die pdf-Datei in eine ordentliche ps-Datei verwandelt. Dann > habe ich die ps-Datei mit ps2ascii behandelt, da kommt nur Schrott raus. > Welche Option(-en) gibst du da an? > > bye > Klaus > > > Ist es vielleicht möglich, dass Deine pdf-Datei den Text als Bild enthält? Ich hatte auch mal ein Buch, bei dem pdftotext nur Hyroglyphen ausspuckte. Ich merkte dann, dass in dem Buch nur die Überschriften als Text hinterlegt waren, nicht aber der eigentliche Text. Probier mal, in der PDF-Datei nach Wörtern zu suchen. Gegebenfalls dann durch eine Texterkennung laufen lassen. Gruß Alfred -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: pdftotext
> > ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem > > Paket "xpdf-utils" kommen aber nur Hyroglyphen raus. > > Kennt sich da jemand aus ? > > Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei > mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten > Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht > viel besser. > > Gruss, > Eduard. Hallo Eduard, pdftops hat mir die pdf-Datei in eine ordentliche ps-Datei verwandelt. Dann habe ich die ps-Datei mit ps2ascii behandelt, da kommt nur Schrott raus. Welche Option(-en) gibst du da an? bye Klaus
Re: pdftotext
#include * Klaus Becker [Sun, May 16 2004, 09:37:31PM]: > Hallo, > > ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem > Paket "xpdf-utils" kommen aber nur Hyroglyphen raus. > Kennt sich da jemand aus ? Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht viel besser. Gruss, Eduard. -- Letzte Worte eines Chemikers: "Erst die Säure dann das Wasser." -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)
pdftotext
Hallo, ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem Paket "xpdf-utils" kommen aber nur Hyroglyphen raus. Kennt sich da jemand aus ? Pdfimages zieht hingegen anstandslos die Bilder raus. tschüs Klaus