Bona nit!
Tinc una qüestiò que segur que em podreu ajudar. Al parell arg-cat, ara
per ara, no s'hi consideren las variants del català. Quan hi ha més
d'una variant dialectal al monodix, el bidix s'encarrega de
seleccionar-ne una, que serà la que es generarà. Però hi ha vegades que
la variaciò és morfològica i es troba dintre d'un paradigma. Per
exemple, "les seves/les seues". Com que el doblet és al paradigma, ja no
es pot seleccionar dès del bidix, i a la sortida apareixen les dos
variants separades per una barra. Un altre eixemple són les formes de
present del verb "endur".
Suposo que la solució més fácil és compilar el monodix per que només
genere les variants "standard", analitzant-les totes. Per a això imagino
que caldrà modificar el Makefile, però no sé com fer-lo. Em podrieu
indicar com fer-ho?
A més, he apuntat algunes de les paraules que el tagger de cat no
selecciona bé. No m'atreveixo encara a proposar regles pel .rlx del cat,
pero veig que l'Hèctor hi està treballant. Les deixo aquí per si poden
servir:
va ser vist --> vist s'interpreta com vestir<vblex><pri><p3><sg>
la seva defensa --> defensa s'interpreta com defensar<vblex><pri><p3><sg>
les seves defenses --> defenses s'interpreta com
defensar<vblex><pri><p2><sg>
la formació de l'estat --> estat s'interpreta com estat<vbser><pp><m><sg>
models bastants generalitzats --> bastants s'interpreta com:
bastar<vblex><ger> . Curiosament, en "pensaments bastants generalizats",
bastants s'interpreta com adverbio.
creu i creus també es confonen prou entre el substantiu i les formes de
"creure".
Juan Pablo
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala