Re: [dic] erreurs dans le dictionnaire

2007-03-16 Par sujet Olivier R.

Laurent Godard a écrit :

Est ce que celà ne vaudrait pas le coup dans ce cas de 'deplier' le 
dictionnaire, faire une appel à revue systematique par des contributeurs 
(on pourrait croiser) plutot que de modifier des drapeaux au coup par 
coups (oui, ca represente 650 000 mots, mais on a pu traiter par le 
passe les 36 000 entrées du dictionnaire de synonymes, donc je pense que 
c'est jouable)


Là, je ne sais pas. Je ne vois pas en quoi c'est plus simple de procéder
ainsi. Il faut quand même regarder la dictionnaire à la loupe. Travail 
de titan!
J'espère que mon programme 'Savant' s'avèrera plus efficace quand je 
l'aurai fini...



Le repliage peut se faire par outil type munch/unmunch (je suis preneur 
de tout outil contribué au projet lingucomponent pour remplacer ceux qui 
seraient pas bon :-) )


J'ai écrit un programme munch en Python, en avril 2006.
Il fonctionnait bien si on lui donnait des listes séparées en deux
catégories différentes: une liste de verbes et une autre liste pour tout
le reste.
Quand les verbes et le reste étaient mêlés, le résultat était moins bon,
mais bien plus cohérent que ce que faisait le munch déjà existant, du
moins pour le français.


Agnès Souque a écrit :


J'ai bien utilisé le programme munch que vous citez. Je n'en connais
pas d'autre... D'ailleurs, si quelqu'un a mieux à proposer,
je suis preneuse...


Mon programme n'est pas meilleur. Il est écrit spécifiquement pour le
fichier des affixes français actuel. Il n'est pas adapté à ce que vous
faites (ou avez fait), car j'ai dû inclure dans le code tout un ensemble
de cas particuliers spécifiques au fichier des affixes français.
J'en ai parlé ici:
http://fr.openoffice.org/servlets/ReadMsg?list=dic&msgNo=476

Voilà des tests effectués avec le munch de MySpell:
http://fr.openoffice.org/servlets/ReadMsg?list=dic&msgNo=472
Cf. fin de ce mail pour comparer le résultat des mêmes échantillons avec 
mon programme.


Je ne me suis pas du tout occupé du dictionnaire entre juin et décembre
2006, et j'avoue que je ne me souviens plus très bien où j'en étais dans
l'écriture de munch, qui reste à affiner, et surtout à optimiser pour
"muncher" des gros fichiers, car c'est une usine à gaz, très lente pour
traiter les 642000 entrées du dictionnaire déplié.

Là, je l'ai lancé munch, pour voir, et il tourne depuis 20 mins sur mon
Athlon XP 2600+ 1Go.
En un quart d'heure, il a placé tous les drapeaux u g v c d w x y z p q
possibles qui servent à la conjugaison des verbes. Il a
trouvé 89777 occurrences.
Depuis lors, le programme cherche à éliminer les drapeaux surnuméraires
(cette méthode n'est pas optimisée, et il lui faudra entre 6 et 9 heures 
pour finir, j'estime). ça prend du temps, car chaque occurence des 
drapeaux placés est comparée avec tous les autres pour éviter les 
redondances. (89777x89777 analyses à faire!)

Ensuite, il s'occupera des préfixes pour les verbes : M j n m t l s
Puis des suffixes pour les non-verbes : F G S X
Puis des préfixes pour les non-verbes : C D N P R O W L Q U
Bref, c'est encore bien trop long.

La raison pour laquelle je segmente ainsi les passages, c'est que ça
permet d'éviter bon nombre de confusions et de redondances dans les
drapeaux.

Je reprendrai le développement de munch quand j'aurai fini Savant.
Je suis certain de pouvoir accélérer son fonctionnement, car je ne me
suis presque pas encore occupé de cet aspect, et je pense qu'il fait des
tonnes de tests inutiles (notamment sur la recherche des drapeaux 
surnuméraires) qu'on peut probablement éviter avec des

heuristiques.
Mais si les sources vous intéressent dès maintenant, je peux les 
fournir. Le programme a été écrit avec Python 2.4, j'ignore si c'est 
compatible avec les versions antérieures. Pas de wxPython cette fois, ça 
devrait tourner sous Linux.



Olivier


PS.

Résultats de munch (version perso) avec les échantillons sur lesquels 
j'ai testé munch (version MySpell) :


Résultat avec la liste de noms:
14
actrice/G
ardente/F
astrale/G
chats
cheval/X
fraise/S
gentille/F
grecque/F
moi
sèche/F
toi
vendeuse/G
ventail/X
éventail/S


Résultat avec la liste de verbes:
51
contredirai/x
contredire/y
contredis/gw
contredisais/d
contrefaire/y
contrefais/g
contrefaisais/d
contreferai/x
dédirai/x
dédire/y
dédis/gw
dédisais/d
patinai/w
patinais/v
patine/u
patiner/y
patinerai/x
s'aguerrissait/q
s'aguichait/p
s'aguiche/p
s'aidait/p
s'aide/p
s'aigrissait/q
s'aiguille/p
s'aiguillonnait/p
s'aiguillonne/p
souscrirai/x
souscrire/z
souscris/g
souscrivais/v
souscrivis/w
tordais/vc
tordis/w
tordrai/x
tordre/y
tords/u
trairai/Rx
traire/Ry
trais/Rg
tressaillais/v
tressaille/u
tressaillir/y
tressaillirai/x
tressaillis/w
vomir/y
vomirai/x
vomis/w
vomissais/v
vêtir/z
vêtirai/x
vêtis/w

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-16 Par sujet Agnes SOUQUE

Le 15/03/07, Olivier R. <[EMAIL PROTECTED]> a écrit :


jean beney a écrit :

>> Concernant la revue des drapeaux inutiles
>> le travail d'agnes pourrait peut etre être utile
>> http://w3.u-grenoble3.fr/lebarbe/agnes/
>
> J'ai regardé le site. Malgré un certain flou dans le texte, je crois
> comprendre qu'elle obtient bien moins de drapeaux que ce qui existe
> actuellement.



Bonjour, je suis l'auteur du travail dont vous parlez. Effectivement, mon
outil automatique génère bien moins de drapeaux  (entre 100 et 250 selon les
paramètres) que la version faite à la main (environ 600). Cependant, avec 3
ou 4 fois moins de drapeaux, j'obtiens un taux de compression du
dictionnaire presque équivalent à celui déjà existant, à savoir 81% au lieu
de 85%.
Les résultats présentés dans mon rapport en ligne sont les résultats d'une
première évaluation de l'outil, avec des paramètres choisis plus ou moins de
manière empirique. Des tests plus récents réalisés dans le cadre d'une
analyse paramétrique nous ont permis de constater que le nombre de drapeaux
n'a a priori pas d'influence sur le taux de compression.
(Les résultats de cette étude paramétrique seront en ligne prochainement)

Si j'ai bien compris, le dictionnaire qu'elle obtient en générant

automatiquement des affixes est moins compressé que celui déjà existant,
malgré ses erreurs et ses doublons.
Ceci dit, il y a une chose qui n'est pas précisé dans son rapport, c'est
quel programme "munch" elle a utilisé.
Si c'est celui-ci:

http://lingucomponent.openoffice.org/source/browse/lingucomponent/source/spellcheck/myspell/
il génère une liste mal fichue et pleine de redondances pour autant que
je me souvienne; il n'est pas bien adapté au fichier des affixes
français. Je l'avais essayé l'an dernier.



J'ai bien utilisé le programme munch que vous citez. Je n'en connais pas
d'autre... D'ailleurs, si quelqu'un a mieux à proposer, je suis preneuse...



Cela ne m'étonne pas, vu les paramètres qu'elle utilise



Comme je le disais plus haut, les paramètres utilisés pour les premiers
tests ont été choisis un peu empiriquement. Le but était juste d'avoir une
première évaluation de l'outil. D'autres tests ont été réalisés, et d'autres
encore à venir...

et vu qu'elle

> recherche des préfixes (ou suffixes) communs, alors que la méthode
> existante classe sous le même drapeau des formes différentes de préfixes
> (de, dé, des) ou des suffixes différents (ais, ant, ...).
> Il faudrait connaître les affixes qu'elle a trouvé pour voir si certains
> peuvent utilement être ajoutés à ceux existant.



En ce qui concerne la méthode de classement d'affixe, elle est effectivement
différente de la méthode existante qui classe les affixes linguistiquement
selon leur type. Le classement de nos affixes se fait au contraire en
fonction des mots auxquels ils sont applicables. La plupart des affixes que
nous pouvons observer dans les fichiers générés à l'issue de nos tests ne
sont pas interprétables linguistiquement. Je ne pense pas d'ailleurs que
certains d'entre eux puissent être ajoutés à ceux existants.


Je suis d'accord.



Il y les préfixes suivants dans le fichier des affixes du dictionnaire
réformé de 1990:

PFX T Y 1
PFX T   0  sur.

PFX C Y 2
PFX C   0  contre [^aàâeèéêiîoôu½]
PFX C   0  contr  [aàâeèéêiîoôu½]

Ceux qui ont fait ce dictionnaire ont eux aussi choisi de supprimer les
drapeaux que j'ai enlevés, ainsi que d'autres.
http://wiki.services.openoffice.org/wiki/Dictionaries


>> de plus, j'ai du mal à comprendre la notion de drapeaux inutiles
>
> Peut-être parce que personne ne parle de drapeaux "inutiles". Olivier a
> supprimé des drapeaux inutilisés et moi j'ai repéré les combinaisons
> lemme/drapeau qui sont improductives.

Oui, ils sont inutilisés et de surcroît vraiment peu intuitifs à
l'emploi (c'est peut-être pour ça qu'ils ne sont pas utilisés
d'ailleurs). J'ai donc effectivement choisi de ne pas les intégrer dans
mon application.


> .
> J'ai passé en revue les drapeaux qui apparaissent en double. Je suggère
> les corrections suivantes :

> accastillais/jnlvv   accastillais/jnlv + mt?
> accastillerai/jnlxx  accastillerai/jnlx + mt?

accastiller : garnir un navire de ses structures au-dessus du pont
supérieur.
le "m" n'est donc pas de mise;
le "t" pourrait convenir, si les marins s'adressent à leur navire comme
on peut le faire parfois avec les objets...


> Et il me semble que tous les autres drapeaux en double peuvent être
> simplement supprimés :

Absolument. Les doublons n'ont aucune utilité.
Une procédure automatique réglera facilement ce problème.


> moulais/Rvvcde plus le c fait double emploi avec moulante/F

Il n'est pas certain qu'il faille ôter ce genre de doublon. Je me pose
la question. Si on introduit un champ "morphologie" pour chaque entrée
du dictionnaire, on pourrait avoir plein de doublons du genre:
amoureuse/LMF   nomcommun
amoureuse/LMF   adjectif
Un correcteur g

Re: [dic] erreurs dans le dictionnaire

2007-03-16 Par sujet Laurent Godard

Re jean

Personnellement, j'ai déplié le dictionnaire par un petit script (qui 
ajoute les traits morphologiques aux verbes) et j'ai comparé le résultat 
avec le lexique de l'ABU (http://abu.cnam.fr/DICO/).

Cela m'a permis de limiter le travail aux différences entre les deux.

Comme on m'a signalé d'autres lexiques, je compte refaire la manip de 
comparaison avec ceux-ci.


je peux te proposer egalement le travail de Myriam Lechelt qui a 
travaille sur le correcteur grammatical
on avait a l'epoque travaillé sur l'etiquettage du dictionnaire de l'abu 
 + complements avec des verbes conjugués IIRC


http://blogs.nuxeo.com/sections/blogs/myriam_lechelt
http://blogs.nuxeo.com/sections/blogs/laurent_godard/2005_04_11_ooo_indico_utilisation

est ce que ca t'interresse ? il y en a pour quelques megas mais je peux 
t'envoyer sa derniere version (ou la mettre à disposition)


comment recuperes tu l'information des tarits morphologiques avec le 
.aff ? est ce que tu es obligé de faire une hypothese sur les drapeaux ?


pour information, j'avais à l'epoque ajouté les categories grammaticales 
 au thesaurus (http://www.indesko.com/news/evolution_du_thesaur)


je suis preneur de ton petit script (en quel langage ?)

Laurent

--
Laurent Godard <[EMAIL PROTECTED]> - Ingénierie OpenOffice.org - 
http://www.indesko.com
Nuxeo Enterprise Content Management >> http://www.nuxeo.com - 
http://www.nuxeo.org

Livre "Programmation OpenOffice.org", Eyrolles 2004-2006

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-16 Par sujet jean beney

Laurent Godard wrote:

Est ce que celà ne vaudrait pas le coup dans ce cas de 'deplier' le 
dictionnaire, faire une appel à revue systematique par des 
contributeurs (on pourrait croiser) plutot que de modifier des 
drapeaux au coup par coups (oui, ca represente 650 000 mots, mais on a 
pu traiter par le passe les 36 000 entrées du dictionnaire de 
synonymes, donc je pense que c'est jouable)


Personnellement, j'ai déplié le dictionnaire par un petit script (qui 
ajoute les traits morphologiques aux verbes) et j'ai comparé le résultat 
avec le lexique de l'ABU (http://abu.cnam.fr/DICO/).

Cela m'a permis de limiter le travail aux différences entre les deux.

Comme on m'a signalé d'autres lexiques, je compte refaire la manip de 
comparaison avec ceux-ci.


Jean

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-16 Par sujet Laurent Godard

Bonjour


médisais/v donne :
médisez

médisais/d
médites


Il faut donc supprimer le d.


oui

mais est ce que celà ne veut pas dire que la liste de depart de mots 
contient des erreurs ?


Est ce que celà ne vaudrait pas le coup dans ce cas de 'deplier' le 
dictionnaire, faire une appel à revue systematique par des contributeurs 
(on pourrait croiser) plutot que de modifier des drapeaux au coup par 
coups (oui, ca represente 650 000 mots, mais on a pu traiter par le 
passe les 36 000 entrées du dictionnaire de synonymes, donc je pense que 
c'est jouable)


Le repliage peut se faire par outil type munch/unmunch (je suis preneur 
de tout outil contribué au projet lingucomponent pour remplacer ceux qui 
seraient pas bon :-) )


Bon, je suis un peu court en temps en ce moment malheuresement ...

Laurent

--
Laurent Godard <[EMAIL PROTECTED]> - Ingénierie OpenOffice.org - 
http://www.indesko.com
Nuxeo Enterprise Content Management >> http://www.nuxeo.com - 
http://www.nuxeo.org

Livre "Programmation OpenOffice.org", Eyrolles 2004-2006

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-16 Par sujet jean beney

Olivier R. wrote:


moulais/Rvvcde plus le c fait double emploi avec moulante/F


Il n'est pas certain qu'il faille ôter ce genre de doublon. Je me pose 
la question.


Effectivement on aura souvent des doublons ne différant que par le type, 
mais dans ce cas, les deux constructions donnent des adjectifs.



médisais/dcvc   de plus le d fait double emploi avec le v


médisais/v donne :
médisez

médisais/d
médites


Il faut donc supprimer le d.

Jean

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-15 Par sujet Olivier R.

jean beney a écrit :


Concernant la revue des drapeaux inutiles
le travail d'agnes pourrait peut etre être utile
http://w3.u-grenoble3.fr/lebarbe/agnes/


J'ai regardé le site. Malgré un certain flou dans le texte, je crois 
comprendre qu'elle obtient bien moins de drapeaux que ce qui existe 
actuellement.


Si j'ai bien compris, le dictionnaire qu'elle obtient en générant 
automatiquement des affixes est moins compressé que celui déjà existant, 
malgré ses erreurs et ses doublons.
Ceci dit, il y a une chose qui n'est pas précisé dans son rapport, c'est 
quel programme "munch" elle a utilisé.

Si c'est celui-ci:
http://lingucomponent.openoffice.org/source/browse/lingucomponent/source/spellcheck/myspell/
il génère une liste mal fichue et pleine de redondances pour autant que 
je me souvienne; il n'est pas bien adapté au fichier des affixes 
français. Je l'avais essayé l'an dernier.



Cela ne m'étonne pas, vu les paramètres qu'elle utilise et vu qu'elle 
recherche des préfixes (ou suffixes) communs, alors que la méthode 
existante classe sous le même drapeau des formes différentes de préfixes 
(de, dé, des) ou des suffixes différents (ais, ant, ...).
Il faudrait connaître les affixes qu'elle a trouvé pour voir si certains 
peuvent utilement être ajoutés à ceux existant.


Je suis d'accord.


Il y les préfixes suivants dans le fichier des affixes du dictionnaire 
réformé de 1990:


PFX T Y 1
PFX T   0  sur.

PFX C Y 2
PFX C   0  contre [^aàâeèéêiîoôu½]
PFX C   0  contr  [aàâeèéêiîoôu½]

Ceux qui ont fait ce dictionnaire ont eux aussi choisi de supprimer les 
drapeaux que j'ai enlevés, ainsi que d'autres.

http://wiki.services.openoffice.org/wiki/Dictionaries



de plus, j'ai du mal à comprendre la notion de drapeaux inutiles


Peut-être parce que personne ne parle de drapeaux "inutiles". Olivier a 
supprimé des drapeaux inutilisés et moi j'ai repéré les combinaisons 
lemme/drapeau qui sont improductives.


Oui, ils sont inutilisés et de surcroît vraiment peu intuitifs à 
l'emploi (c'est peut-être pour ça qu'ils ne sont pas utilisés 
d'ailleurs). J'ai donc effectivement choisi de ne pas les intégrer dans 
mon application.




.
J'ai passé en revue les drapeaux qui apparaissent en double. Je suggère 
les corrections suivantes :



accastillais/jnlvv   accastillais/jnlv + mt?
accastillerai/jnlxx  accastillerai/jnlx + mt?


accastiller : garnir un navire de ses structures au-dessus du pont 
supérieur.

le "m" n'est donc pas de mise;
le "t" pourrait convenir, si les marins s'adressent à leur navire comme 
on peut le faire parfois avec les objets...



Et il me semble que tous les autres drapeaux en double peuvent être 
simplement supprimés :


Absolument. Les doublons n'ont aucune utilité.
Une procédure automatique réglera facilement ce problème.



moulais/Rvvcde plus le c fait double emploi avec moulante/F


Il n'est pas certain qu'il faille ôter ce genre de doublon. Je me pose 
la question. Si on introduit un champ "morphologie" pour chaque entrée 
du dictionnaire, on pourrait avoir plein de doublons du genre:

amoureuse/LMF   nomcommun
amoureuse/LMF   adjectif
Un correcteur grammatical pourrait avoir besoin de ce champ pour 
simplifier son boulot...




médisais/dcvc   de plus le d fait double emploi avec le v


médisais/v donne :
médisaient
médisais
médisait
médisant
médisez
médisiez
médisions
médisons

médisais/d
médisaient
médisais
médisait
médisant
médisiez
médisions
médisons
médites



avec/MMQ   de plus le Q fait double emploi avec qu'avec


Oui, il y a souvent des entrées qui n'ont pas été effacées malgré leur 
reproduction possible avec d'autres entrées à drapeaux.
C'est notamment le cas des verbes commençant par "s'" (élision de se) 
qui sont reproduits pas les entrées avec les drapeaux p et q.

Là encore, une procédure réglera le problème.



Olivier

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-15 Par sujet jean beney

Laurent Godard wrote:


Bonjour

Concernant la revue des drapeaux inutiles
le travail d'agnes pourrait peut etre être utile
http://w3.u-grenoble3.fr/lebarbe/agnes/


J'ai regardé le site. Malgré un certain flou dans le texte, je crois 
comprendre qu'elle obtient bien moins de drapeaux que ce qui existe 
actuellement.
Cela ne m'étonne pas, vu les paramètres qu'elle utilise et vu qu'elle 
recherche des préfixes (ou suffixes) communs, alors que la méthode 
existante classe sous le même drapeau des formes différentes de préfixes 
(de, dé, des) ou des suffixes différents (ais, ant, ...).
Il faudrait connaître les affixes qu'elle a trouvé pour voir si certains 
peuvent utilement être ajoutés à ceux existant.



de plus, j'ai du mal à comprendre la notion de drapeaux inutiles


Peut-être parce que personne ne parle de drapeaux "inutiles". Olivier a 
supprimé des drapeaux inutilisés et moi j'ai repéré les combinaisons 
lemme/drapeau qui sont improductives.

.
J'ai passé en revue les drapeaux qui apparaissent en double. Je suggère 
les corrections suivantes :


épouiller/nmntlM épouiller/smntlM
aménageais/jmtlvvaménageais/jmtlvn
allégeais/jmtlvv allégeais/jmtlvn
accastillais/jnlvv   accastillais/jnlv + mt?
accastillerai/jnlxx  accastillerai/jnlx + mt?
abrégeais/jmtlvv abrégeais/jmtlvn
aller/LMSnM  aller/snmtlM
halener/jnlynlM  halener/snmtlM
oranger/LMSnlM   oranger/LMS smntl
il/SsQS  il/sQS  + M
errata/LMM   errata/LMS
attellerai/jmtlxxattellerai/jmtlxn
ambre/LMLjnluambre/LMSjnlu
aire/LMSjnuL aire/LMSjnul

Et il me semble que tous les autres drapeaux en double peuvent être 
simplement supprimés :


moulais/Rvvcde plus le c fait double emploi avec moulante/F
médisais/dcvc   de plus le d fait double emploi avec le v
avec/MMQ   de plus le Q fait double emploi avec qu'avec
absorber/snlMsnmtlM
automatiser/smtsnmtlM
asséner/snlmtlM
entremettre/smtsnmtlM
ouvrais/jnlvjnmtlv
absorbais/jnlvjnmtlv
peignais/DRvv
maudissais/vvc
fondais/vvc
ouvre/jnlujnmtlu
absorbe/jnlujnmtlu
absorberai/jnlxjnmtlx
absorbai/jnlwjnmtlw
équipement/LMRSLMS
écriture/LMRSLMS
ressortis/uww
expropriai/jnmntlw
engloutirai/jnmntlx
engrenai/jnmntlw
expulsai/jnmntlw
ondée/LMFLM
onglée/LMFLM
ouvrante/LMFLM
ondine/LMFLM
onciale/LMFLM
invariante/LMFLM
inclémente/LMFLM
ignorante/LMFLM
heure/LMFLM
étendue/LMFLM
épinière/LMFLM
avenue/LMFLM
assemblée/LMFLM
ambre/LMLMSjnlu+ mt?
esquive/LMFLMjnmtlu
épouse/LMFjnmtlu
inactive/LMFLMjnlu
obit/LMLMS
maudis/uuww
vis/RRPw
une/LMLQS
umlaut/LMSS
paramétrage/RSS
oxygénée/FLMF
ouvre-bouteilles/LMM
ouvre-boîtes/LMM
on/LMLQ
ombre/LMSSjnmtlu
officier/LMSn
normalisation/RSS
lot/SS
liquidable/SS
invective/LMSSjnmtlu
inquiète/FLMFjnmtlu
infatuée/FLMF
incunable/LMSS
imbécillité/SLMS
hôtesse/LMSS
hint/LMSS
expulsai/jnmntlw
embruns/LMM
émaciée/FLMF
elzévirienne/FLMF
dus/RRw
constitution/RSS
euro/LMSS
errata/LMM
équidé/LMSS
éperdue/FLMF
envahisseur/SLMS
avril/LMM
avant-bras/LMM
au/LMXQX
assoiffée/FLMF
assaut/LMSS
arrivée/LFLM
aromatisée/FLMF
archer/LMSS
arcane/LMSS
août/LMM
anodisée/FLMF
annelée/FLMF
américanisée/FLMF
alambiquée/FLMF
aileron/SLMS
âge/LMSS
affection/SLMS
adirée/FLMF
acte/LMSljnlu
acidulée/FLMF
abbé/LMSS

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-14 Par sujet Laurent Godard

Bonjour

Concernant la revue des drapeaux inutiles
le travail d'agnes pourrait peut etre être utile
http://w3.u-grenoble3.fr/lebarbe/agnes/

de plus, j'ai du mal à comprendre la notion de drapeaux inutiles
est ce que ca veux dire que le programme munch/unmunch ne ferrait pas 
correctement son travail ?


Laurent

--
Laurent Godard <[EMAIL PROTECTED]> - Ingénierie OpenOffice.org - 
http://www.indesko.com
Nuxeo Enterprise Content Management >> http://www.nuxeo.com - 
http://www.nuxeo.org

Livre "Programmation OpenOffice.org", Eyrolles 2004-2006

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-14 Par sujet jean beney

Olivier R. wrote:


Avez-vous vu le fichier des affixes documenté?
Il aide à sa compréhension:
http://fr.openoffice.org/Documentation/Guides/fr_FR.aff.document%E9


Merci pour l'info.

J'ai épluché les drapeaux autres improductifs et voilà le résultat :
caillebottai/v  caillebottai/w
couchaillais/V   couchaillais/v
déjaunis/uwy déjaunis/uw + déjaunir/y
receveuse/Gg receveuse/G
tonna/w tonnai/w
pourvoyeur/G pourvoyeuse/G
togolaiss/Ftogolaise/F

âtre/LMX âtre/LMS
bourgmestre/Xbourgmestre/S
calviniste/X calviniste/S
épilatoire/LMX   épilatoire/LMS
rénette/Xrénette/S
congestion/X congestion/S
garde-côte/X garde-côte/S
nourriture/X nourriture/S
nuitée/Xnuitée/S

Supprimer le S :
accès/LMS  
boss/S

bouseux/S
chemiseries/S
cliquetis/S
condoléances/S
croix/S
dadais/S
éboulis/LMS
edelweiss/LMS
enclos/LMSjnl
épistaxis/LMS
freux/S
herpès/LMS
humérus/LMS
index/LMS
macareux/S
malinois/S
manganeux/S
mercureux/S
millas/S
motteux/S
noix/S
oestrus/LMS
oie/XLMS
pape/S
périgueux/S
physalis/S
pucheux/S
pyroligneux/S
quadruplex/S
sélénieux/S
thymus/S
utérus/LMS
ventis/S

Supprimer le X :
anachronisme/XLMS  
articulaire/XLMS   
auberge/XLMS

bisexuelle/FX
cantonale/FX
chaumière/SX
cordelière/FX
détentrice/XG
dévastatrice/XG
dilatable/XS
efficace/XLMS
gendre/XS
hémisphère/XLMS
hydrographique/XLMS
ingambe/XLMS
lâcheuse/XG
losange/XS
national-socialisme
nourriture/X
nouveau-né/SX
sonnerie/XS
sous-ensemble/XS
station/SX
synonymie/XS
synonymique/XS
suave/XS
patente/FXu
proéminence/XS
volumétrique/SX
pape/XS

Jean Beney

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-13 Par sujet Olivier R.

jean beney a écrit :

Je n'ai pas pris le temps d'installer le logiciel car je n'ai qu'un 
vieux python et il faut que je réinstalle tout.


Ne vous embêtez plus avec ça pour l'instant, car je réadapte mon 
application pour qu'elle soit utilisable sous Linux, et j'en profite 
pour simplifier l'interface utilisateur. Il sera aussi possible 
d'ajouter des verbes du troisième groupe. Je n'avais pas implémanté 
cette possibilité auparavant, car il était écrit je ne sais plus où que 
le dictionnaire les contenait déjà tous. Mais j'ai vu que vous en 
proposiez...


Finalement, je ne sais pas encore s'il faudra wxPython en UTF-8 ou en 
ANSI. L'UTF-8 me pose plein de problèmes, alors je suis repassé à l'ANSI.


Je vais essayer de faire marcher la bête sous Linux pour la prochaine 
version.




vidéo/LMSSvidéo/S ???


Oui, L et M sont de trop. Et aucun préfixe existant ne convient.



s'acceptais/p???


C'est  s'acceptait/p


Avez-vous vu le fichier des affixes documenté?
Il aide à sa compréhension:
http://fr.openoffice.org/Documentation/Guides/fr_FR.aff.document%E9


Olivier

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-13 Par sujet jean beney

Bonjour,

Je n'ai pas pris le temps d'installer le logiciel car je n'ai qu'un 
vieux python et il faut que je réinstalle tout.


Mais voici d'autres erreurs que j'ai trouvé en repérant les préfixes 
improductifs parce qu'ils sont accolés à un lemme qui ne correspond pas.


caillebottai/v  ->  caillebottai/w
désemplis/v désemplis/v
magouillai/vmagouillai/v
resalis/v   resalis/uw
fuis/w  fuis/gw
rassis/wrassis/uw
ris/g   ris/gw


il manque y et Y dans les listes de voyelles (une paire d'yeux)
[^aàâeèéêiîoôuhs] et [aàâeèéêiîoôuhoeæAÀÂEÈÉÊIÎOÔUHOEÆ]
au passage pour le préfixe M la a est en double : [aàâeèéêiîoôuhoeæ a 
AÀÂEÈÉÊIÎOÔUHOEÆ]


préfixes improductifs :
correctionnalise/U correctionnalise/u
délabyrinthais/s   délabyrinthais/v
déparasite/U   déparasite/u
doue/U   doue/u
l'usinière/LMF   usinière/LMF
reformais/s   reformais/v
rescinder/t   rescinder/y
vidéo/LMSSvidéo/S ???

suffixes improductifs sur des verbes
comploterai/c   ->   comploterai/x
inclurai/jnmtlux supprimer u
contre-murer/uy  contre-murer/y + contre-mure/u
cuber/uy cuber/y + cube/u
gréerai/ygréerai/x
mâchouille/uymâchouille/u + mâchouiller/y
magouillai/v magouillai/w
ratifia/wratifiai/w
renveloppe/z renveloppe/x
resalis/vresalis/uw
renveloppe/z renveloppe/u
restaurais/vxc   restaurais/vc
s'acceptais/p???
ressouviendra/x  ressouviendrai/x
trafiquerai/ytrafiquerai/x
nourrirrai/y nourrirrai/x
nombrerai/y  nombrerai/x
nais/g   nais/u
inclurai/jnmtlux inclurai/jnmtlx
halener/jnlxnlM  halener/jnlynlM
fris/gw  fris/uw
désemplis/v  désemplis/uw
déjaunis/uwy déjaunis/uw  déjaunir/y
contre-murer/uy  contre-murer/y

Ils reste quelques autres lemmes à  étudier.
J'ai aussi une liste de 154 drapeau en double. Je ne sais pas quand 
j'aurai le temps de voir s'il suffit de les supprimer ou s'il faut 
mettre un autre drapeau à la place.


Jean Beney

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-09 Par sujet Olivier R.

Bonjour,

J'ai vu passer l'annonce de l'outil savant et je l'essayerais volontiers 
pour indiquer quelques autres erreurs, mais je travaille sous Linux :-(


Je vous ai envoyé les sources par mail.


J'ai d'ailleurs ajouté des lignes (115 en tout)dans la plupart des 
autres drapeaux pour traiter un maximum de verbes irréguliers. Le 
résultat sera bientôt disponible (voir mon prochain message).


http://fr.openoffice.org/servlets/ReadMsg?list=dic&msgNo=477

Après vérification de certains drapeaux, j'ai constaté que les préfixes 
suivants, peu utilisés, ne l'étaient de surcroît que par erreur :


drapeau : occurrences dans le dictionnaire
A  :  1
E  :  0
I  :  1
B  :  1
H  :  1
K  :  1
J  :  1
Y  :  0
Z  :  0
a  :  0
b  :  0
e  :  5
f  :  1
i  :  0
k  :  1

Toutes les entrées du dictionnaire ayant ces drapeaux étaient incorrectes.

Comme ceux-ci ne sont pas employés et n'ont guère d'intérêt, à mon avis, 
j'ai décidé de ne pas les intégrer dans mon logiciel. Cela présente 
l'avantage de clarifier grandement la liste confuse des préfixes.


De plus, ces drapeaux avaient déjà été effacés du fichier des affixes 
pour le dictionnaire de la réforme de 1990.




Avec l'aide du petit Robert, j'ai traité un grand nombre de ces verbes.


Vous pouvez déjà les entrées dans la base, sauf les verbes du 3e 
groupes. Je crois que je vais prévoir la possibilité d'insérer certaines 
entrées avec moins de contrôle.



Olivier R.

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-03-09 Par sujet jean beney

Bonjour,

J'ai vu passer l'annonce de l'outil savant et je l'essayerais volontiers 
pour indiquer quelques autres erreurs, mais je travaille sous Linux :-(


Aubéron wrote:---


> Les verbes conclure, inclure, exclure, occlure sont un peu seuls de
> leur espèce et leurs participes passés sont mal traités. Pour
> conclure/y on ne trouve que
>
> >SFX y   ureu  clure
>
> tandis que les lignes suivantes ne sont jamais utilisées :
>
> >SFX z   re se clure
> >SFX z   re sesclure
>
> Il faudrait mettre :
> SFX y   ureu  clure
> SFX y   ureu  clure
> SFX y   re se clure
> SFX y   re sesclure

Que changez-vous au juste?
Vous avez juste ajouté une ligne identique à la première.


La ligne identique était une erreur (il manque un s).
J'ai ajouté pour le drapeau y,  4 lignes pour les 4 formes du participe 
passé de conclure, exclure et reclure :

 SFX y   ureu  clure
 SFX y   ureus  clure
 SFX y   re se clure
 SFX y   re sesclure

et en définitive j'ai aussi complété le drapeau z pour inclure et occlure :
SFX z   re s   clure
SFX z   re se clure
SFX z   re sesclure

J'ai d'ailleurs ajouté des lignes (115 en tout)dans la plupart des 
autres drapeaux pour traiter un maximum de verbes irréguliers. Le 
résultat sera bientôt disponible (voir mon prochain message).



L'ajout des verbes du premier et du second groupe sera facile.
Par contre, pour le troisième groupe, il faudra regarder en détail 
pour la conjugaison de chacun. 


Avec l'aide du petit Robert, j'ai traité un grand nombre de ces verbes.

Voici encore quelques erreurs :

caillebottai/v  ->  caillebottai/w
ris/w -> ris/uw
nourrirrai/y -> nourrirai/x
trafiquai/x -> trafiquai/w
trafiquerai/y -> trafiquerai/x
rapprends/u -> rapprends/g
pars/DR -> pars/DRu
chauvis/u est  incomplet (il manque "chauvent")
vagis/u -> vagis/uw
sevre/u -> sèvre/u
sevrerai/x -> sèvrerai/x
tonna/w -> tonnai/w
pourvoyeur/G -> pourvoyeuse/G

supprimer crus/w

ajouter R dans
entendais/jnmtlv entendis/jnmtlw entendrai/jnmtlx
entendre/snmtlM entends/jnmtlu

ajouter c dans 
SFX g   s  t  [cldf]is

SFX g   0  ent[cldf]is
SFX g   0  e  [cldf]is
SFX g   0  es [cldf]is
car circoncire se conjugue comme suffire

il manque
SFX w   us urent  moulus   

J'ai aussi aperçu un certain nombre de drapeaux en double,  mais n'ai 
pas pris le temps de vérifier si on pouvait se contenter de les 
supprimer ou s'il faut les remplacer par un autre drapeau. Je signale 
juste ce doublon :

départ/S part/DRS

les verbes impersonnels ci-dessous donne des formes qui n'existent pas:
avère/jnlu
avérerai/jnlx
floconnai/w
floconnais/vc
floconne/u
floconnerai/x
incombai/jnw
incombais/jnv

de même que
tressaillir/y

Jean Beney


-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-02-27 Par sujet Aubéron

Bonjour,

Ne désespérez pas... :)
Pour l'instant, à ma connaissance, personne ne s'occupe officiellement 
des modifications du/des dictionnaire(s) français.

Mais je prends note de toutes vos remarques.

J'espère pouvoir fournir lundi une première version d'un logiciel 
permettant d'enregistrer dans une base de données en ligne toutes les 
modifications proposées pour le dictionnaire.



Puis-je faire quelque chose pour qu'elles soient corrigées dans la 
version officielle ?


Je présume que le mieux, pour l'instant, consiste à envoyer le 
dictionnaire entier avec vos corrections à Laurent Godard. Il est 
inscrit sur cette liste, je présume.



Ou mieux, quelqu'un peut-il les vérifier (on ne sait jamais) et les 
officialiser ?


Le logiciel permettra de vérifier les modifications proposées en 
affichant toutes les déclinaisons des lemmes. Ensuite, les utilisateurs 
pourront voter pour ou contre les propositions.




sous-titre/Su  mélange verbe/nom


Ce n'est pas vraiment une erreur.
Dans les spécifications de Myspell, je crois me souvenir qu'il ne faut 
pas qu'il y ait deux fois le même lemme dans le dictionnaire. Par 
contre, dans les spécifications de Hunspell, c'est possible.


Il sera toujours possible de séparer les verbes et les non-verbes avec 
une procédure automatique, si nécessaire. Ce n'est utile, je pense, que 
si pour chaque entrée on définit un champ "morphologie" (champ utile 
pour le futur éventuel correcteur grammatical).


Dans les spécifications de Hunspell, le dictionnaire reconnaît cette 
grammaire:

lemme
lemme/drapeaux
lemme/drapeaux[tabulation]morphologie

---

En consultant la liste en ligne, je viens de m'apercevoir que j'ai 
encore raté un de vos messages. Je dois effacer trop vite les messages 
quand je fais le tri...



> Les verbes conclure, inclure, exclure, occlure sont un peu seuls de
> leur espèce et leurs participes passés sont mal traités. Pour
> conclure/y on ne trouve que
>
> >SFX y   ureu  clure
>
> tandis que les lignes suivantes ne sont jamais utilisées :
>
> >SFX z   re se clure
> >SFX z   re sesclure
>
> Il faudrait mettre :
> SFX y   ureu  clure
> SFX y   ureu  clure
> SFX y   re se clure
> SFX y   re sesclure

Que changez-vous au juste?
Vous avez juste ajouté une ligne identique à la première.

J'ai noté le reste.
Intéressantes, toutes vos corrections sur le fichier des affixes.
Merci pour vos remarques.


# 5) J'ai croisé ce lexique avec celui de l'ABU et j'ai trouvé 350
# infinitifs que l'on peut ajouter si on le juge utile. Il est probable
# que certains de ces verbes apparaissent déjà sous d'autres formes.

L'ajout des verbes du premier et du second groupe sera facile.
Par contre, pour le troisième groupe, il faudra regarder en détail pour 
la conjugaison de chacun.


-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-02-27 Par sujet jean beney

J'ai encore une petite fournée d'erreurs à vous communiquer.
Puis-je faire quelquec chose pour qu'elles soient corrigées dans la 
version officielle ?
Ou mieux, quelqu'un peut-il les vérifier (on ne sait jamais) et les 
officialiser ?


Jean Beney

__
comploterai/c -> comploterai/x
de même pour :
composerai/w décintrerai/w dévaluerai/w dévisserai/w dévoilerai/w 
épiloguerai/wx

fourcherai/w liserai/w palabrerai/w parerai/w pommerai/w portraiturerai/w
procurerai/w raviverai/w razzierai/w réabonnerai/w recoucherai/w
rééquilibrerai/w rempaillerai/w scintillerai/w

désobstruais/w  ->v
machinais/w  ->v
pataugeais/vw  ->v
dénébulisais/w  ->v
planchéiais/w  ->v
sabrais/vw  ->sabrai/w + sabrais/v
terris/uw ?
sous-titre/Su  mélange verbe/nom
crûs/v  -> crûs/w
déjaunis/uwy -> uw
mentir/y   donne menties
désemplis/v -> désemplis/uw
modélisai/x -W  modélisai/w
fris/gw -> fris/g  pas de passé simple
incluais/uv -> incluais/v
interdisais/jnmtld -> interdisais/jnmtlv  différent de dire
liserai/x -> liserai/xw verbe liserer
s'pprochait/p -> s'approchait/p
émoulus/w  n'est pas une forme verbale
luire/Ry -> luire/R intransitif
nombrerai/y -> nombrerai/x
raidirai/x ->  raidirai/x
ressouviendra/x -> ressouviendrai/x
rassis/w -> rassis/uw
saillis/w -> saillis/uw
acquérir/y -> acquérir/z
caillebottai/v  ->  caillebottai/w
bruir/y -> bruire/y

tressaillir/y  à  supprimer car intransitif
avère/u  à supprimer car impersonnel

ajouter c dans 
SFX g   s  t  [cldf]is

SFX g   0  ent[cldf]is
SFX g   0  e  [cldf]is
SFX g   0  es [cldf]is
car circoncire se conjugue comme suffire

SFX y   oître  û  croître
SFX y   oître  us croître
SFX y   oître  ue croître
SFX y   oître  uescroître

SFX z   oître  u  croître
SFX z   oître  us croître
SFX z   oître  ue croître
SFX z   oître  uescroître

croître/Ry décroître/z





-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-02-09 Par sujet jean beney

Bonjour,

J'ai d'autres anomalies à signaler.

1) Les verbres conclure, inclure, exclure, occlure sont un peu seuls de 
leur espèce et leurs participes passés sont mal traités. Pour conclure/y 
on ne trouve que



SFX y   ureu  clure
 


tandis que les lignes suivantes ne sontjamais utilisées :


SFX z   re se clure
SFX z   re sesclure
 


Il faudrait mettre :
SFX y   ureu  clure
SFX y   ureu  clure
SFX y   re se clure
SFX y   re sesclure

2) pour les verbes
contredire, dédire, dire, médire, prédire, interdire,  confire, 
suffire (circoncire n'est pas traité)

on trouve

SFX y   re ts [df]ire
SFX y   re te [df]ire
SFX y   re tes[df]ire

il faudrait
SFX y   re ts [df]ire
SFX y   re t  [df]ire
SFX y   re te [df]ire
SFX y   re tes[df]ire

3) circoncire/y n'est pas productif ; il manque :
SFX y   re s cire
SFX y   re se   cire
SFX y   re ses cire

4) reconquérir/z  (idem pour requérir/z) donne :
reconquis  reconquise  reconquises  
reconquéru reconquérus reconquérue reconquérues 
car peuvent s'appliquer :

SFX z   ir u  [^o]ir
SFX z   ir us [^o]ir
SFX z   ir ue [^o]ir
SFX z   ir ues[^o]ir

voici une solution:
SFX z   ir u  courir   
SFX z   ir us courir   
SFX z   ir ue courir   
SFX z   ir uescourir   
SFX z   ir u  [^or]ir   
SFX z   ir us [^or]ir   
SFX z   ir ue [^or]ir   
SFX z   ir ues[^or]ir   

5) J'ai croisé ce lexique avec celui de l'ABU et j'ai trouvé 350 
infinitifs que l'on peut ajouter si on le juge utile. Il est probable 
que certains de ces verbes apparaissentdéjà sous d'autres formes.


aborner   acenser   acyler   adsorber   affacturer
affaiter   aicher   allotir   amuïr   anuiter   aponter
apparoir   appendre   auner   badauder   bagouler   baliverner
balustrer   bancher   bêcheveter   bestialiser   bouliner   bretailler
bringuebaler   budgéter   carbonitrurer   cartayer   caséifier   catégoriser
charioter   chevretter   chromiser   cibler   circuiter   clamecer
coalescer   coconner   cocoter   cogérer   comparoir   contre-bouter
contreventer   copartager   coqueriquer   craboter   crédibiliser   
croupionner

cuider   dansoter   débéqueter   décérébrer   déciller   décoaguler
décoconner   décommettre   décompresser   déconfire   découdre   découvrir
défaire   défenestrer   dégriffer   dégrouper   déléaturer   délicoter
démacler   démettre   démutiser   densifier   départir   dépeindre
déplaire   déprendre   désatelliser   déscolariser   déséchafauder   
désertifier

désexciter   dessuinter   déstaliniser   déstructurer   détenir   détorquer
détoxiquer   dévêtir   diéser   dudgeonner   ébousiner   ébroudir
écabocher   effiloquer   égueuler   élaver   élier   embatre
embéguiner   emmeuler   encaster   encelluler   enchaussumer   enchevaler
encoubler   encroiser   engaller   enkikiner   ennoyer   enquerre
ensimer   ensuivre   entrobliger   énuquer   envaler   escoffier
escofier   espagnoliser   étatiser   étranger   éventiller   extradosser
farandoler   ferrouter   festiner   fidéliser   floquer   fonctionnaliser
fosserer   fraser   fromager   gambier   gastrectomiser   gaudir
gourbiller   gournabler   grattouiller   gravillonner   grouiner   grusiner
houssiner   incidenter   indianiser   interconnecter   jacter   justicier
liquater   lixivier   lucher   mâchouiller   magyariser   mandriner
margauder   marsupialiser   merder   métaboliser   morfaler   morfier
morganer   moufeter   mythifier   nébuliser   néologiser   nigauder
niquer   nonupler   nucléariser   occire   orientaliser   outer
parcoriser   passager   passiver   pastiquer   patarasser   paysager
pelauder   perreyer   pinceauter   polyploïdiser   présélectionner   
prévaloir

prévoir   prismatiser   professionnaliser   putter   quimper   raboutir
raire   ramarder   rassir   raucher   réagir   rebobiner
rebouillir   récoler   recombiner   reconnaître   recoudre   recourir
recouvrir   recroître   recueillir   recuire   redécouvrir   redessiner
redevoir   redire   redormir   réécrire   réentendre   réétudier
refaire   refuir   rejoindre   relire   reluire   rembaucher
remettre   remoudre   renaître   renduire   repaître   repartir
repeindre   repleuvoir   repoudrer   reprendre   reproduire   resavoir
réséquer   ressembler   retenir   retomber   retraduire   retraire
retraverser   retreindre   revaloir   revasculariser   revêtir   revoir
riser   roussiller   ruginer   saietter   sailler   scarifier
secréter   sélecter   sourdre   stupéfaire   surarmer   surcapitaliser
surtondre   tacler   tarmacadamisertélécharger  télépiloter   
tensionner  
tosser   toupiner   trachéo

Re: [dic] erreurs dans le dictionnaire

2007-01-29 Par sujet Aubéron

jean beney a écrit :

j'ai encore vu quelques coquilles dans le dictionnaire :

   s'accotait/P  donne prés'accotait   remplacer P par p
   correctionnalise/U déparasite/U doue/U sont improductifs 
remplacer U par u

   rivulair/Se mettre  rivulaire/S
   homogénéifierai/knlxremplacer k par j


J'en prends note. :)


En ce qui concerne l'erreur déjà signalée sur le drapeau C avec presser. 
Il s'avère qu'on peut le supprimer car les formes de compresser 
apparaissent par ailleurs.


On s'apperçoit alors que les drapeaux C, Z, b, f, k, E, Y, Z, O, a et i 
ne sont jamais utilisés.


ABHW ne sont utilisés qu'avec fixation pour donner affixation, 
d'affixation, préfixation, suffixation ;-)


Oui, les préfixes sont en général peu (et mal?) utilisés.
Dans les archives de cette liste, vous trouverez le décompte des affixes 
du dictionnaire fr_FR que j'avais effectué.

http://fr.openoffice.org/servlets/ReadMsg?list=dic&msgNo=477

D'ailleurs, en consultant les archives, je m'aperçois que ma réponse à 
vos précédents messages n'est jamais parvenue à destination (une erreur 
de ma part...)


Je vous avais envoyé un programme en Python pour manipuler le dictionnaire.
Vous pouvez le télécharger ici:
http://morgen.abend.stern.free.fr/Savant/SavantMaster.7z

Si jamais il vous demande des librairies manquantes, je vous les 
enverrai. Je n'ai pas le droit de les distribuer. (voir le fichier 
"librairies nécessaires.txt")
Ou bien, vous pouvez installer Python 2.4/2.5 et wxPython 2.8 et 
simplement exécuter les sources qui sont fournies dans l'archive.

C'est l'un de mes programmes encore en cours de développement.

Cordialement,
A.

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-01-29 Par sujet jean beney

Bonjour,

j'ai encore vu quelques coquilles dans le dictionnaire :

   s'accotait/P  donne prés'accotait   remplacer P par p
   correctionnalise/U déparasite/U doue/U sont improductifs 
remplacer U par u

   rivulair/Se mettre  rivulaire/S
   homogénéifierai/knlxremplacer k par j

En ce qui concerne l'erreur déjà signalée sur le drapeau C avec presser. 
Il s'avère qu'on peut le supprimer car les formes de compresser 
apparaissent par ailleurs.


On s'apperçoit alors que les drapeaux C, Z, b, f, k, E, Y, Z, O, a et i 
ne sont jamais utilisés.


ABHW ne sont utilisés qu'avec fixation pour donner affixation, 
d'affixation, préfixation, suffixation ;-)


Jean

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-01-25 Par sujet jean beney
À peine avais-je envoyé le message que je pense avoir trouvé la réponse 
à ma dernière réponse.


Elle se trouve dans l'indicateur Y/N de la déclaration du drapeau. Ici, 
le N interdit de combiner le j' avec des suffixes modifiés.


Jean



-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-01-24 Par sujet jean beney

Merci pour la réponse.

Entre temps, j'ai aussi vu passer les bizareries suivantes :
   désembourgeoise/e  donne   
l'exdésembourgeoise
   alto/lMS  il serait plus propre 
de mettre L

   inexpugnable/lMS  idem
   maille/Sefait double emploi 
avec  émaille/jnmtlu

   reformais/s improductif voir reformai/w
   entorse/LMSt donne   t'entorse
   destituai/e  donne   
l'exdestituai

par ailleurs il manque des formes de éclore :  éclosez, ...

et j'ai des doutes sur :
  obéirai/jnx
auquel on pourrait ajouter j' (drapeau j)  et, par exemple, retirer le i 
final (drapeau x, deuxième ligne) ; ce qui donnerait   j'obéira

Or ce mot n'est pas accepté. Pourquoi ?

Jean

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [dic] erreurs dans le dictionnaire

2007-01-23 Par sujet Aubéron

Bonjour,

jean beney a écrit :
Me penchant sur la génération des formes de mots à partir de fr_FR.aff 
et fr_FR.dic, je constate une anomalie dans la description du drapeau C :


PFX C Y 4
PFX C   0  con[^lmr]
PFX C   0  col[l]
PFX C   0  com[m]
PFX C   0  cor[r]

Il faudrait aussi mettre com devant b ou p.


Oui, vous avez raison.
J'ai vérifié dans dans le dictionnaire : le drapeau C n'apparaît que 
cinq fois au total.


pressai/Cw
pressais/Cvc
presse/Cu
presser/Cy
presserai/Cx

On peut donc modifier le fichier des affixes sans craindre d'effets 
secondaires indésirables.


Je joins ici un fichier des affixes avec cette correction, plus celles 
que j'ai effectuées moi-même.


Votre proposition :

PFX C Y 4
PFX C   0  con[^blmpr]
PFX C   0  col[l]
PFX C   0  com[bmp]
PFX C   0  cor[r]


J'ai aussi ajouté les lignes :

MAP 12
MAP aàâä
MAP eéèêë
MAP iîï
MAP oôö
MAP uùûü
MAP cç
MAP AÀÂÄ
MAP EÉÈÊË
MAP IÎÏ
MAP OÔÖ
MAP UÙÛÜ
MAP CÇ

REP 8
REP f ph
REP ph f
REP c qu
REP qu c
REP œ oe
REP oe œ
REP æ ae
REP ae æ

Modifications : j'ai ajouté les ligatures œ et æ dans les champs 
conditionnels


PFX D Y 2
PFX D   0  dé [^aàâeèéêiîoôuhœæ]
PFX D   0  dés[aàâeèéêiîoôuhœæ]

PFX j N 1
PFX j   0  j' [aàâeèéêiîoôuhœæ]

PFX n Y 2
PFX n   0  n' [aàâeèéêiîoôuhœæ]
PFX n   0  qu'[aàâeèéêiîoôuhœæ]

PFX L N 1
PFX L   0  l' [aàâeèéêiîoôuhœæAÀÂEÈÉÊIÎOÔUHŒÆ]

PFX M Y 1
PFX M   0  d' [aàâeèéêiîoôuhœæaAÀÂEÈÉÊIÎOÔUHŒÆ]



Par ailleurs je suis tombé sur des erreurs dans l'utilisation des 
drapeaux dans la liste des mots, ce qui peut autoriser des mots 
inexistants :


délabyrinthais/s qui ne donne rien
illégalité/lmSqui donne m'illégalité
ségrégée/f  qui donne j'exségrégée, il manque S
triglyph/Sequi donne aussi triglyphs
tuberculinisatio/Sn   il manque tuberculinisation et n est improductif
il/SsQS  double S


Il y a pas mal d'autres erreurs de ce genre.

Voilà les entrées correctes:

délabyrinthais/v
illégalité/LMS
ségrégée/F
triglyphe/S
tuberculinisation/S
il/QsS



Quelqu'un s'occupe-t-il de ces corrections?


A ma connaissance, personne ne s'occupe de joindre les modifications de 
chacun.


De mon côté, je suis en train d'écrire une application permettant de 
proposer de nouvelles entrées et de modifier le dictionnaire, et 
d'envoyer les propositions dans une base de données commune. Mais ça me 
prend du temps et je ne sais pas quand ce sera fini.



Aubéron
SET ISO8859-15
TRY eiarsntolucéÉmpdgbhfvqjyxèÈzâÂkêÊçÇîÎïÏwûÛôÔàÀëËüÜöÖóÓíÍùÙáÁäĜæŒÆ

MAP 12
MAP aàâä
MAP eéèêë
MAP iîï
MAP oôö
MAP uùûü
MAP cç
MAP AÀÂÄ
MAP EÉÈÊË
MAP IÎÏ
MAP OÔÖ
MAP UÙÛÜ
MAP CÇ

REP 8
REP f ph
REP ph f
REP c qu
REP qu c
REP œ oe
REP oe œ
REP æ ae
REP ae æ

PFX A Y 10
PFX A   0  ad [^bcdfglmnpqrst]
PFX A   0  a  [bdgm]
PFX A   0  ac [cq]
PFX A   0  af [f]
PFX A   0  al [l]
PFX A   0  an [n]
PFX A   0  ap [p]
PFX A   0  ar [r]
PFX A   0  as [s]
PFX A   0  at [t]

PFX B Y 10
PFX B   0  d'ad   [^bcdfglmnpqrst]
PFX B   0  d'a[bdgm]
PFX B   0  d'ac   [cq]
PFX B   0  d'af   [f]
PFX B   0  d'al   [l]
PFX B   0  d'an   [n]
PFX B   0  d'ap   [p]
PFX B   0  d'ar   [r]
PFX B   0  d'as   [s]
PFX B   0  d'at   [t]

PFX H N 10
PFX H   0  l'ad   [^bcdfglmnpqrst]
PFX H   0  l'a[bdgm]
PFX H   0  l'ac   [cq]
PFX H   0  l'af   [f]
PFX H   0  l'al   [l]
PFX H   0  l'an   [n]
PFX H   0  l'ap   [p]
PFX H   0  l'ar   [r]
PFX H   0  l'as   [s]
PFX H   0  l'at   [t]

PFX C Y 4
PFX C   0  con[^blmpr]
PFX C   0  col[l]
PFX C   0  com[bmp]
PFX C   0  cor[r]

PFX D Y 2
PFX D   0  dé [^aàâeèéêiîoôuhœæ]
PFX D   0  dés[aàâeèéêiîoôuhœæ]

PFX N Y 2
PFX N   0  dis[^f]
PFX N   0  dif[f]

PFX E Y 3
PFX E   0  ex [^flmnrv]
PFX E   0  é  [lmnrv]
PFX E   0  ef [f]

PFX Y Y 3
PFX Y   0  d'ex   [^flmnrv]
PFX Y   0  d'é[lmnrv]
PFX Y   0  d'ef   [f]

PFX Z N 3
PFX Z   0  l'ex   [^flmnrv]
PFX Z   0  l'é[lmnrv]
PFX Z   0  l'ef   [f]

PFX I Y 4
PFX I   0  in [^blmpr]
PFX I   0  il [l]
PFX I   0  im [bmp]
PFX I   0  ir [r]

PFX J Y 4
PFX J   0  d'in   [

[dic] erreurs dans le dictionnaire

2007-01-22 Par sujet jean beney

Bonjour,

Me penchant sur la génération des formes de mots à partir de fr_FR.aff 
et fr_FR.dic, je constate une anomalie dans la description du drapeau C :


PFX C Y 4
PFX C   0  con[^lmr]
PFX C   0  col[l]
PFX C   0  com[m]
PFX C   0  cor[r]

Il faudrait aussi mettre com devant b ou p.

à partir de la ligne :
presser/Cy
on obtient "conpresser" qui est effectivement accepté par open-office.

Par ailleurs je suis tombé sur des erreurs dans l'utilisation des 
drapeaux dans la liste des mots, ce qui peut autoriser des mots 
inexistants :


délabyrinthais/s qui ne donne rien
illégalité/lmSqui donne m'illégalité
ségrégée/f  qui donne j'exségrégée, il manque S
triglyph/Sequi donne aussi triglyphs
tuberculinisatio/Sn   il manque tuberculinisation et n est improductif
il/SsQS  double S

Quelqu'un s'occupe-t-il de ces corrections?

Jean

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]