azremg a écrit :
> Bonjour,
Bonjour Rémi,

> 
> je suis étudiant en Traitement Automatique de la Langue et travaille
> actuellement sur un projet recherche concernant le découpage  de mots en
> syllabes. Serait-il possible que quelqu'un m'explique de quelle manière la
> coupure des mots est réalisée dans OOo : le dictionnaire Hyphen contient-il
> le découpage possible pour tous les mots de la langue, y a-t-il un
> algorithme qui permet de découper la majorité des mots en se passant de
> dictionnaire, ....
> 
L'analyse se fonde sur un algorithme
(voir:
http://sourceforge.net/docman/display_doc.php?docid=29374&group_id=143754)
 s'appuyant pour chaque langue sur:
- une liste de mots (fichier(s) .dic)
- des règles de construction/dérivation des différentes formes
grammaticales (préfixes, formes conjuguées, pluriels, etc.) stockées
dans des fichiers Affixes (.aff).

La syntaxe de ces fichiers affixes est décrite dans le lien précédant.
Voir également http://hunspell.sourceforge.net/tb87nemeth.pdf

Je ne saurais trop te conseiller de t'inscrire sur la liste dic
(mailto://dic-subscribe "à robe" fr "poing" openoffice "poing" org)
ou tu retrouveras des experts francophones. Peut-être serait-il
intéressant pour toi de te joindre au projet actuel mené par Olivier R. ?
Voir http://dico.savant.free.fr/

Par ailleurs, si ton champ de recherche couvre également l'analyse
grammaticale, sache qu'il existe un autre projet pour fournir à OOo un
correcteur grammatical sous licence libre pour lequel une coopération
Université / communauté OOo peut s'envisager.

> En vous remerciant (et un peu au nom de la science aussi),
> 
Elle vous en prie (... la Science! ;-) )
> 
> Rémi.
> 
Gilles.

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Répondre à