Re: wordGenerator, pdfGenerator ?

Sylvain Wallez Mon, 06 Jun 2005 06:05:28 -0700

Frédéric Glorieux wrote:

  Bonjour,
J'ai besoin d'extraire au moins le texte de fichiers word et pdf. Ilfaut craindre que le XML généré se résumera d'abord à un seul élémentracine du genre <text/>.
Est-ce que cette sorte de generators auraient déjà été faits oupensés? Pour l'instant je vois 2 librairies sur lesquelles s'appuyer,<http://www.textmining.org> et <http://www.pdfbox.org/>. Est-ce qu'ily aurait mieux ?

En opensource, c'est à ma connaissance ce qui revient le plus souventsur ces sujets.


Sylvain

--
Sylvain Wallez                        Anyware Technologies
http://apache.org/~sylvain            http://anyware-tech.com
Apache Software Foundation Member     Research & Technology Director


---------------------------------------------------------------------
Liste francophone Apache Cocoon -- http://cocoon.apache.org/fr/
Pour vous desinscrire : mailto:[EMAIL PROTECTED]
Autres commandes : mailto:[EMAIL PROTECTED]

Re: wordGenerator, pdfGenerator ?

Répondre à