Très chers confrères :)

Ma (très) longue absence traduit le bonheur de vivre depuis quelques 
temps avec deux petits bébés merveilleux (Alexandre et Maxime). J'espère 
que depuis lors, vos projets ont pu aboutir ou évoluer...

Pour ma part, je présenterai un papier à la "7ème Journées Francophones 
de l'Extraction et de la Gestion des Connaissances" (EGC 2007 : 
http://www.info.fundp.ac.be/egc2007/ , 23-26 janvier, Namur(Belgique) )

La présentation est intitulée : "*Pertinence des moteurs de recherche 
web à aspiration indexation distribuées sur infrastructure GRID*"
Le papier fait notamment référence à l'article de Jérome Charron "Le 
Pire Tout Pire" 
http://motrech.blogspot.com/2006/01/le-pire-tout-pire.html et traduit 
une année de recherche sur le sujet avec la collaboration de 
l'université de Liège (Belgique).

Le document est en cours de rédaction (je l'écris d'abord en anglais, 
car je dois également le présenter dans d'autres conférences).

Merci de commenter l'affirmation suivante :

"It is very important to note that we consider (for this document) :

    * document parsing (ie : html to text) as being part of the crawling
      process
    * document analysis (language matching, document ranking, extra
      analysis) as being part of the indexing process"

Certains d'entre vous désignent-ils l'analyse de document comme une 
partie de la phase de parsing ?

Merci d'avance.

Christophe Noël
Systèmes distribués
CETIC - Charleroi (Belgique)




---------------------------------
motrech - http://motrech.free.fr/
frutch  - http://www.frutch.org/
--------------------------------- 
Liens Yahoo! Groupes

<*> Pour consulter votre groupe en ligne, accédez à :
    http://fr.groups.yahoo.com/group/motrech/

<*> Pour vous désincrire de ce groupe, envoyez un mail à :
    [EMAIL PROTECTED]

<*> L'utilisation de Yahoo! Groupes est soumise à l'acceptation des :
    http://fr.docs.yahoo.com/info/utos.html
 



Répondre à