Hola Juan Pablo,

Ja me n'encarrego avui de les ambigüitats que dius. Ja hi tinc bastant la
mà trencada i són importants de resoldre per a totes les llengües que
depenen del català. De les que dius, l'ambigüitat d' "estat" i, en general,
la tria entre nom i verb conjugat, el sistema sovint no les tracta bé.
Així, doncs, vaig afegint regles específiques. Després d'afegir-les, les
provo amb un petit corpus de 5000 frases amb el traductor cat-spa, que
entenc que és el més utilitzat i, per tant, el més sensible.

Quant a l'altra qüestió, no en puc dir res. Per ara no he treballat amb
traductors al català amb apertium-cat.

Cordialment,
Hèctor

El dia 6 de setembre de 2017 a les 3:13, Juan Pablo Martínez <
jpm...@unizar.es> ha escrit:

> Bona nit!
>
> Tinc una qüestiò que segur que em podreu ajudar. Al parell arg-cat, ara
> per ara, no s'hi consideren las variants del català. Quan hi ha més d'una
> variant dialectal al monodix, el bidix s'encarrega de seleccionar-ne una,
> que serà la que es generarà. Però hi ha vegades que la variaciò és
> morfològica i es troba dintre d'un paradigma. Per exemple, "les seves/les
> seues". Com que el doblet és al paradigma, ja no es pot seleccionar dès del
> bidix, i a la sortida apareixen les dos variants separades per una barra.
> Un altre eixemple són les formes de present del verb "endur".
>
> Suposo que la solució més fácil és compilar  el monodix per que només
> genere les variants "standard", analitzant-les totes. Per a això imagino
> que caldrà modificar el Makefile, però no sé com fer-lo. Em podrieu indicar
> com fer-ho?
>
> A més, he apuntat algunes de les paraules que el tagger de cat no
> selecciona bé. No m'atreveixo encara a proposar regles pel .rlx del cat,
> pero veig que l'Hèctor hi està treballant. Les deixo aquí per si poden
> servir:
>
> va ser vist --> vist s'interpreta com vestir<vblex><pri><p3><sg>
>
> la seva defensa --> defensa s'interpreta com defensar<vblex><pri><p3><sg>
> les seves defenses --> defenses s'interpreta com
> defensar<vblex><pri><p2><sg>
>
> la formació de l'estat --> estat s'interpreta com estat<vbser><pp><m><sg>
>
> models bastants generalitzats --> bastants s'interpreta com:
> bastar<vblex><ger> . Curiosament, en "pensaments bastants generalizats",
> bastants s'interpreta com adverbio.
>
> creu i creus també es confonen prou entre el substantiu i les formes de
> "creure".
>
> Juan Pablo
>
> ------------------------------------------------------------
> ------------------
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> _______________________________________________
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to