[motrech] Nouveau moteur ?

2006-05-10 Par sujet Jean-Marie Le Ray



Bonjour la liste,

http://www.yacy.net/yacy/

Vous connaissez ? Qu'en pensez-vous ?

-- 
Jean-Marie Le Ray

http://www.adscriptor.com
http://www.studio92.net


[Les parties de ce message comportant autre chose que du texte seul on été supprimées]







-
motrech - http://motrech.free.fr/
frutch - http://www.frutch.org/
-





  




  
Liens Yahoo! Groupes

Pour consulter votre groupe en ligne, accédez à :http://fr.groups.yahoo.com/group/motrech/
Pour vous désincrire de ce groupe, envoyez un mail à :[EMAIL PROTECTED]
L'utilisation de Yahoo! Groupes est soumise à l'acceptation des conditions d'utilisation.











Re: [motrech] Nouveau moteur ?

2006-05-10 Par sujet Jérôme Charron



 http://www.yacy.net/yacy/
 Vous connaissez ?

Pas en détail, mais j'ai déjà un peu regardé.


 Qu'en pensez-vous ?

 Globalement, ce que je pense de l'approche p2p pour un moteur de recherche:

http://motrech.blogspot.com/2006/01/le-pire-tout-pire.html

Sinon rapidement:

1. J'aime beaucoup l'approche proxy pour récupérer le contenu à indexer
plutôt que de faire du crawling:

... we collect information by simply using the information that passes the
proxy.

Je pense depuis longtemps que les proxy sont réellement sous-utilisés.
Les providers ne se rendent certainement pas bien compte de l'or qui leur
passe entre les tuyaux:
Ils disposent en temps réel des URLs consultées par les internautes:

1.1 ça leur permettrait de découvrir de nouveaux URLs très facilement (même
si ce sont des documents qui ne sont reliés à aucun autre, ou faiblement
connecté).
1.2 ça leur permettrait de récupérer directement le contenu qui passe chez
eux et de le valoriser en le stockant et l'indexant, sans avoir besoin de
crawler le web (économie et valorisation de la bande passante).
1.3 ça leur permettrait de faire une sorte de UsageRank : Ils connaissent
dans leur réseau quelle sont les URLs les plus demandées = permettrait de
scorer en fonction de ce critère

Bref, je me demande depuis pas mal de temps pourquoi des gens comme Free qui
font preuve de beaucoup d'innovations ne valorisent pas plus le moteur
Dir.com d'Iliad en le couplant à leurs proxys... c'est un mystère pour moi.
Ils pourraient faire un truc terrible chez Free / Dir.com en terme de moteur
de recherche!

2. Les temps de réponse d'une archi p2p ne sont pas bons:
Because we need some redundancy to compensate for missing peers, we ask
several peers simultanously. To collect their response, we wait a little
time of at most 6 seconds. If this is not enough, the user may start a
re-search to catch up 'late' responses from other peers.
Cette réponse ne me semble pas acceptable... non?

Jérôme

--
http://motrech.free.fr/
http://www.frutch.org/


[Les parties de ce message comportant autre chose que du texte seul on été supprimées]







-
motrech - http://motrech.free.fr/
frutch - http://www.frutch.org/
-





  




  
Liens Yahoo! Groupes

Pour consulter votre groupe en ligne, accédez à :http://fr.groups.yahoo.com/group/motrech/
Pour vous désincrire de ce groupe, envoyez un mail à :[EMAIL PROTECTED]
L'utilisation de Yahoo! Groupes est soumise à l'acceptation des conditions d'utilisation.












Re: [motrech] Nouveau moteur ?

2006-05-10 Par sujet Jean-Marie Le Ray



Jérôme,

ton explication est un peu technique pour moi, mais à lire ton point 1)
effectivement ça semble difficile à comprendre. Tu en as parlé à Jean
Véronis ? Il me semble qu'il connaît bien Dir.com, il pourrait leur souffler
à l'oreille ce que tu viens de m'expliquer !
J-M


2006/5/10, Jérôme Charron [EMAIL PROTECTED]:

  http://www.yacy.net/yacy/
  Vous connaissez ?

 Pas en détail, mais j'ai déjà un peu regardé.


  Qu'en pensez-vous ?

 Globalement, ce que je pense de l'approche p2p pour un moteur de
 recherche:

 http://motrech.blogspot.com/2006/01/le-pire-tout-pire.html

 Sinon rapidement:

 1. J'aime beaucoup l'approche proxy pour récupérer le contenu à indexer
 plutôt que de faire du crawling:

 ... we collect information by simply using the information that passes
 the
 proxy.

 Je pense depuis longtemps que les proxy sont réellement sous-utilisés.
 Les providers ne se rendent certainement pas bien compte de l'or qui leur
 passe entre les tuyaux:
 Ils disposent en temps réel des URLs consultées par les internautes:

 1.1 ça leur permettrait de découvrir de nouveaux URLs très facilement
 (même
 si ce sont des documents qui ne sont reliés à aucun autre, ou faiblement
 connecté).
 1.2 ça leur permettrait de récupérer directement le contenu qui passe chez
 eux et de le valoriser en le stockant et l'indexant, sans avoir besoin de
 crawler le web (économie et valorisation de la bande passante).
 1.3 ça leur permettrait de faire une sorte de UsageRank : Ils connaissent
 dans leur réseau quelle sont les URLs les plus demandées = permettrait de
 scorer en fonction de ce critère

 Bref, je me demande depuis pas mal de temps pourquoi des gens comme Free
 qui
 font preuve de beaucoup d'innovations ne valorisent pas plus le moteur
 Dir.com http://dir.com/ d'Iliad en le couplant à leurs proxys... c'est
 un mystère pour moi.
 Ils pourraient faire un truc terrible chez Free / Dir.comhttp://dir.com/en terme de moteur
 de recherche!

 2. Les temps de réponse d'une archi p2p ne sont pas bons:
 Because we need some redundancy to compensate for missing peers, we ask
 several peers simultanously. To collect their response, we wait a little
 time of at most 6 seconds. If this is not enough, the user may start a
 re-search to catch up 'late' responses from other peers.
 Cette réponse ne me semble pas acceptable... non?

 Jérôme

 --
 http://motrech.free.fr/
 http://www.frutch.org/


 [Les parties de ce message comportant autre chose que du texte seul on été
 supprimées]



 -
 motrech - http://motrech.free.fr/
 frutch - http://www.frutch.org/
 -


 --
 *Liens Yahoo! Groupes*

 - Pour consulter votre groupe en ligne, accédez à :
 http://fr.groups.yahoo.com/group/motrech/

 - Pour vous désincrire de ce groupe, envoyez un mail à :
 [EMAIL PROTECTED][EMAIL PROTECTED]

 - L'utilisation de Yahoo! Groupes est soumise à l'acceptation des conditions
 d'utilisation http://fr.docs.yahoo.com/info/utos.html.




-- 
Jean-Marie Le Ray

http://www.adscriptor.com
http://www.emantics.com
http://www.studio92.net
http://jmleray.googlepages.com


[Les parties de ce message comportant autre chose que du texte seul on été supprimées]







-
motrech - http://motrech.free.fr/
frutch - http://www.frutch.org/
-





  




  
Liens Yahoo! Groupes

Pour consulter votre groupe en ligne, accédez à :http://fr.groups.yahoo.com/group/motrech/
Pour vous désincrire de ce groupe, envoyez un mail à :[EMAIL PROTECTED]
L'utilisation de Yahoo! Groupes est soumise à l'acceptation des conditions d'utilisation.











Re: [motrech] Nouveau moteur ?

2006-05-10 Par sujet Jérôme Charron



 ton explication est un peu technique pour moi, mais à lire ton point 1)
 effectivement ça semble difficile à comprendre. Tu en as parlé à Jean
 Véronis ? Il me semble qu'il connaît bien Dir.com, il pourrait leur
 souffler
 à l'oreille ce que tu viens de m'expliquer !

Jean-Marie, oui, j'ai déjà évoqué ce genre de choses (et d'autres) avec Jean
et Philippe Develter (Dir.com) lors d'un repas fort agréable d'ailleurs!
;-)
Mais pour le moment, Dir.com est comment dire ... un peu (beaucoup?) en mode
veille...
**
Jérôme

--
http://motrech.free.fr/
http://www.frutch.org/


[Les parties de ce message comportant autre chose que du texte seul on été supprimées]







-
motrech - http://motrech.free.fr/
frutch - http://www.frutch.org/
-





  




  
Liens Yahoo! Groupes

Pour consulter votre groupe en ligne, accédez à :http://fr.groups.yahoo.com/group/motrech/
Pour vous désincrire de ce groupe, envoyez un mail à :[EMAIL PROTECTED]
L'utilisation de Yahoo! Groupes est soumise à l'acceptation des conditions d'utilisation.