> > Je suis curieux... Je ne connais actuellement pas d'autres moyens
> > d'identifier la langue que celles proposées aujourd'hui par exemple dans
> > Nutch: Utilisation des méta-données + analyse statistique du contenu.
>
> Si je ne me trompe pas, pour identifier la langue actuellement :
> - utilisation d'un algorithme
> - utilisation d'un paramètre de précision -> selon la valeur de ce
> paramètre, la précision grandit parallèlement au temps d'exécution.
> Me trompe-je ?

Plus ou moins oui.
Les paramètres de "précision" sont:
1. le nombre d'octets analysés dans le texte pour déterminer la langue.
2. la taille des ngrams utilisés (2, 3, 4)
En effet, en fonction de ces paramètres la précision va augmenter.
Mais pas parallèlement, car ce sont des algorithmes qui convergent très
rapidement.
Moralité: Ce n'est pas parce qu'on a bcp de temps cpu qu'il faut le
gaspiller...    ;-)


> (PS: As-tu jeté un coup d'oeil sur le framework mapred de Nutch? Qu'en
> > penses-tu?)
> Non, vraiment pas le temps :) Mais tout commentaire m'intéresse sur le
> sujet ! ;)

Question un peu hors sujet sur motrech (je m'en excuse, nous passerons sur
Frutch en private mail si la conversation devient trop longue): Dans les
architectures massivement parallèles que tu connais, comment se fait la
gestion de configuration entre les différents noeud?

Jérôme

--
http://motrech.free.fr/
http://www.frutch.org/


[Les parties de ce message comportant autre chose que du texte seul on été 
supprimées]



---------------------------------
motrech - http://motrech.free.fr/
frutch  - http://www.frutch.org/
--------------------------------- 
Liens Yahoo! Groupes

<*> Pour consulter votre groupe en ligne, accédez à :
    http://fr.groups.yahoo.com/group/motrech/

<*> Pour vous désincrire de ce groupe, envoyez un mail à :
    [EMAIL PROTECTED]

<*> L'utilisation de Yahoo! Groupes est soumise à l'acceptation des :
    http://fr.docs.yahoo.com/info/utos.html
 



Répondre à