Très chers confrères :) Ma (très) longue absence traduit le bonheur de vivre depuis quelques temps avec deux petits bébés merveilleux (Alexandre et Maxime). J'espère que depuis lors, vos projets ont pu aboutir ou évoluer...
Pour ma part, je présenterai un papier à la "7ème Journées Francophones de l'Extraction et de la Gestion des Connaissances" (EGC 2007 : http://www.info.fundp.ac.be/egc2007/ , 23-26 janvier, Namur(Belgique) ) La présentation est intitulée : "*Pertinence des moteurs de recherche web à aspiration indexation distribuées sur infrastructure GRID*" Le papier fait notamment référence à l'article de Jérome Charron "Le Pire Tout Pire" http://motrech.blogspot.com/2006/01/le-pire-tout-pire.html et traduit une année de recherche sur le sujet avec la collaboration de l'université de Liège (Belgique). Le document est en cours de rédaction (je l'écris d'abord en anglais, car je dois également le présenter dans d'autres conférences). Merci de commenter l'affirmation suivante : "It is very important to note that we consider (for this document) : * document parsing (ie : html to text) as being part of the crawling process * document analysis (language matching, document ranking, extra analysis) as being part of the indexing process" Certains d'entre vous désignent-ils l'analyse de document comme une partie de la phase de parsing ? Merci d'avance. Christophe Noël Systèmes distribués CETIC - Charleroi (Belgique) --------------------------------- motrech - http://motrech.free.fr/ frutch - http://www.frutch.org/ --------------------------------- Liens Yahoo! Groupes <*> Pour consulter votre groupe en ligne, accédez à : http://fr.groups.yahoo.com/group/motrech/ <*> Pour vous désincrire de ce groupe, envoyez un mail à : [EMAIL PROTECTED] <*> L'utilisation de Yahoo! Groupes est soumise à l'acceptation des : http://fr.docs.yahoo.com/info/utos.html