wordGenerator, pdfGenerator ?

=?ISO-8859-1?Q?Fr=E9d=E9ric_Glorieux?= Mon, 06 Jun 2005 02:56:30 -0700


  Bonjour,

J'ai besoin d'extraire au moins le texte de fichiers word et pdf. Ilfaut craindre que le XML généré se résumera d'abord à un seul élémentracine du genre <text/>.

Est-ce que cette sorte de generators auraient déjà été faits ou pensés?Pour l'instant je vois 2 librairies sur lesquelles s'appuyer,<http://www.textmining.org> et <http://www.pdfbox.org/>. Est-ce qu'il yaurait mieux ?



--
Frédéric Glorieux ("AJLSM", <http://ajlsm.com>)



---------------------------------------------------------------------
Liste francophone Apache Cocoon -- http://cocoon.apache.org/fr/
Pour vous desinscrire : mailto:[EMAIL PROTECTED]
Autres commandes : mailto:[EMAIL PROTECTED]

wordGenerator, pdfGenerator ?

Répondre à