procmail und pdftotext

2005-03-17 Diskussionsfäden Rainer Bendig aka Ny
-BEGIN PGP SIGNED MESSAGE-
Hash: SHA1

Hi,

ich wuerde gerne PDF-Dateien (application/pdf) durch procmail via
pdftotext automatisch in PlainText Dateien umwandeln, und diese als
zusaetzliches Attachment an die entsprechende Nachricht dranhaengen.

Ist das realisierbar? Wenn ja - Wie?
- -- 
- -
Rainer Bendig aka "Ny" |  http://www.moins.de  | GnuPG-Key 0x41D44F10
-BEGIN PGP SIGNATURE-
Version: GnuPG v1.9.16-cvs (GNU/Linux)

iD8DBQFCOT6YWmkXC0TkjEgRAqxEAJ0fHYbPVNbFcVGeySPLuB4giFqmMQCcCIbH
Uv7Cu83KQDbJudj71H0JROU=
=mFlk
-END PGP SIGNATURE-


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Fwd: Re: pdftotext

2004-05-17 Diskussionsfäden Klaus Becker
>Ist es vielleicht möglich, dass Deine pdf-Datei den Text als Bild
>enthält? Ich hatte auch mal ein Buch, bei dem pdftotext nur Hyroglyphen
>ausspuckte. Ich merkte dann, dass in dem Buch nur die Überschriften als
>Text hinterlegt waren, nicht aber der eigentliche Text. Probier mal, in
>der PDF-Datei nach Wörtern zu suchen. Gegebenfalls dann durch eine
>Texterkennung laufen lassen.

Ich habe  es gerade mit einem anderen pdf-Text versucht, und da klappt es.
Also lag es an der Datei , und das nächste Mal weiss ich Bescheid.

tschüs
Klaus



Re: pdftotext

2004-05-17 Diskussionsfäden Thomas Templin
On Sunday 16 May 2004 23:58, Alfred Ostermeier wrote:
[...]
> Klaus Becker wrote:
> >>>ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus
> >>> dem Paket "xpdf-utils" kommen aber nur Hyroglyphen raus.
> >>>Kennt sich da jemand aus ?
> >>
> >>Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei
> >>mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten
> >>Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht
> >>viel besser.
[...]
> > pdftops hat mir die pdf-Datei in eine ordentliche ps-Datei verwandelt.
> > Dann habe ich die ps-Datei mit ps2ascii behandelt, da kommt nur Schrott
> > raus. Welche Option(-en) gibst du da an?
[...]
> Ist es vielleicht möglich, dass Deine pdf-Datei den Text als Bild
> enthält? Ich hatte auch mal ein Buch, bei dem pdftotext nur Hyroglyphen
> ausspuckte. Ich merkte dann, dass in dem Buch nur die Überschriften als
> Text hinterlegt waren, nicht aber der eigentliche Text. Probier mal, in
> der PDF-Datei nach Wörtern zu suchen. Gegebenfalls dann durch eine
> Texterkennung laufen lassen.
[...]
Versuch das PDF Dokument einmal in KOffice zu öffnen.
Damit sollte am schnellsten zu sehen sein ob es sich um Text oder nur um 
Bilder handelt.

Tschüss,
Thomas



Re: pdftotext

2004-05-16 Diskussionsfäden Alfred Ostermeier
Hallo!

Klaus Becker wrote:
>>>ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem
>>>Paket "xpdf-utils" kommen aber nur Hyroglyphen raus.
>>>Kennt sich da jemand aus ?
>>
>>Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei
>>mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten
>>Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht
>>viel besser.
>>
>>Gruss,
>>Eduard.
> 
> 
> Hallo Eduard,
> 
> pdftops hat mir die pdf-Datei in eine ordentliche ps-Datei verwandelt. Dann 
> habe ich die ps-Datei mit ps2ascii behandelt, da kommt nur Schrott raus. 
> Welche Option(-en) gibst du da an?
> 
> bye
> Klaus
> 
> 
> 

Ist es vielleicht möglich, dass Deine pdf-Datei den Text als Bild
enthält? Ich hatte auch mal ein Buch, bei dem pdftotext nur Hyroglyphen
ausspuckte. Ich merkte dann, dass in dem Buch nur die Überschriften als
Text hinterlegt waren, nicht aber der eigentliche Text. Probier mal, in
der PDF-Datei nach Wörtern zu suchen. Gegebenfalls dann durch eine
Texterkennung laufen lassen.

Gruß
Alfred


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: pdftotext

2004-05-16 Diskussionsfäden Klaus Becker
> > ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem
> > Paket "xpdf-utils" kommen aber nur Hyroglyphen raus.
> > Kennt sich da jemand aus ?
>
> Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei
> mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten
> Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht
> viel besser.
>
> Gruss,
> Eduard.

Hallo Eduard,

pdftops hat mir die pdf-Datei in eine ordentliche ps-Datei verwandelt. Dann 
habe ich die ps-Datei mit ps2ascii behandelt, da kommt nur Schrott raus. 
Welche Option(-en) gibst du da an?

bye
Klaus




Re: pdftotext

2004-05-16 Diskussionsfäden Eduard Bloch
#include 
* Klaus Becker [Sun, May 16 2004, 09:37:31PM]:
> Hallo,
> 
> ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem 
> Paket "xpdf-utils" kommen aber nur Hyroglyphen raus.
> Kennt sich da jemand aus ?

Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei
mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten
Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht
viel besser.

Gruss,
Eduard.
-- 
Letzte Worte eines Chemikers:
  "Erst die Säure dann das Wasser."


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



pdftotext

2004-05-16 Diskussionsfäden Klaus Becker
Hallo,

ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem 
Paket "xpdf-utils" kommen aber nur Hyroglyphen raus.
Kennt sich da jemand aus ?

Pdfimages zieht hingegen anstandslos die Bilder raus.

tschüs
Klaus