PDF indizieren
Hallo, Liste! Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann? Ich danke euch! Luca Bertoncello (lucab...@lucabert.de) ___ Lug-dd maillist - Lug-dd@mailman.schlittermann.de https://ssl.schlittermann.de/mailman/listinfo/lug-dd
Re: PDF indizieren
Hej Luca! Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann? Jain. Full-blown: Desktop-Suchmaschinen. Eigenbaumaterial: pdf{to|2}text Hälsningar Fabian ___ Lug-dd maillist - Lug-dd@mailman.schlittermann.de https://ssl.schlittermann.de/mailman/listinfo/lug-dd
Re: PDF indizieren
Am 16.11.2009 um 16:08 schrieb Luca Bertoncello: Hallo, Liste! Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann? Vielleicht lässt sich hieraus was bauen: http://www.kapustabrothers.com/2008/01/20/indexing-pdf-documents-with-zend_search_lucene/ Ist zwar nicht direkt MySQL, aber Lucene kann gut mit Volltext suchen umgehen. Habe in einem Projekt mit der PHP Version schon einen Index mit über 8GB Daten und Millionen Datensätzen gebaut und es gab gute Antwortzeiten. Peter -- http://www.drantos.com - Software Development ___ Lug-dd maillist - Lug-dd@mailman.schlittermann.de https://ssl.schlittermann.de/mailman/listinfo/lug-dd