PDF indizieren

2009-11-16 Diskussionsfäden Luca Bertoncello
Hallo, Liste!

Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die
Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer
SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann?

Ich danke euch!
Luca Bertoncello
(lucab...@lucabert.de)

___
Lug-dd maillist  -  Lug-dd@mailman.schlittermann.de
https://ssl.schlittermann.de/mailman/listinfo/lug-dd


Re: PDF indizieren

2009-11-16 Diskussionsfäden Fabian Hänsel
Hej Luca!

 Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann
 und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich
 später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs
 suchen kann?

Jain.

Full-blown: Desktop-Suchmaschinen.
Eigenbaumaterial: pdf{to|2}text

Hälsningar
  Fabian

___
Lug-dd maillist  -  Lug-dd@mailman.schlittermann.de
https://ssl.schlittermann.de/mailman/listinfo/lug-dd


Re: PDF indizieren

2009-11-16 Diskussionsfäden Peter Schade

Am 16.11.2009 um 16:08 schrieb Luca Bertoncello:

 Hallo, Liste!
 
 Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die
 Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer
 SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann?

Vielleicht lässt sich hieraus was bauen:
http://www.kapustabrothers.com/2008/01/20/indexing-pdf-documents-with-zend_search_lucene/
Ist zwar nicht direkt MySQL, aber Lucene kann gut mit Volltext suchen umgehen.

Habe in einem Projekt mit der PHP Version schon einen Index mit über 8GB Daten 
und Millionen Datensätzen gebaut und es gab gute Antwortzeiten.

Peter
--
http://www.drantos.com - Software Development


___
Lug-dd maillist  -  Lug-dd@mailman.schlittermann.de
https://ssl.schlittermann.de/mailman/listinfo/lug-dd