Bonjour,

Est-ce que quelqu’un sait comment faire pour indexer fiablement un document excel uploadé dans un document de type fichier ?

Je rencontre à priori des problèmes d’indexation inhérents à l’indexation d’un fichier, converti correctement en html par xlHtml, mais dont les balises TABLE, TD, TR… sont simplement supprimées avant de lancer l’indexation, ce qui cause la concaténation des mots de début et de fin de cellule lors de l’indexation.

Exemple :

| Contenu1 | Contenu 2 | Contenu3 | va être indexé de la sorte :

(u’Contenu1Contenu’ 1), (u’2Contenu3’ 1) …

Et ainsi de suite.

Avez-vous une idée de l’endroit où il faille regarder ?

 

Merci d’avance

 

Cordialement

 

 

Cédric Marfil

Ingénieur conseils en Technologies de l'information

Unilog IT Services NRD

a logicaCMG company

Marcq en Baroeul

Tél: 03.59.56.60.68 (actuellement joignable à la CRMA au 03.20.14.26.36)

Mail: [EMAIL PROTECTED]

 

_______________________________________________
cps-users-fr 
Adresse de la liste : [email protected]
Gestion de l'abonnement : <http://lists.nuxeo.com/mailman/listinfo/cps-users-fr>

Répondre à