Re: [Apertium-catala] publicació spa-cat

2018-04-25 Thread Jaume Ortolà i Font
La versió de què us parlava en aquest missatge ja es pot donar per tancada.

Ara la Generalitat valenciana vol traure actualitzacions freqüents, almenys
durant els pròxims mesos. L'encarregat d'això és Donís Seguí, que s'ha
incorporat fa poc a la llista. No sé com ho hem de gestionar. Amb
publicacions recents de tant en tant poden introduir-se errades, però el
fet de fer-les freqüents també permet corregir aviat.

En LanguageTool posem en producció cada dia una nova compilació, i no sol
haver-hi problemes greus. Però LanguageTool incorpora moltíssims tests, que
el fan molt robust.

Salutacions,
Jaume Ortolà


El dia 20 d’abril de 2018 a les 15:04, Jaume Ortolà i Font <
jaumeort...@gmail.com> ha escrit:

> Bon dia,
>
> A principi de maig la Generalitat valenciana farà públic el seu nou portal
> de traducció i correcció, basat en Apertium i LanguageTool.
>
> Els pròxims dies estaria bé no introduir massa novetats en el parell
> spa-cat, acabar de revisar el testvoc[1] i fer els tests que puguem. Si hi
> podeu col·laborar...
>
> En el testvoc no sé com s'han d'arreglar algunes paraules de les
> categories menys habituals: pronoms, relatius, adverbis...
>
> Salutacions,
> Jaume Ortolà
>
> [1] https://github.com/apertium/apertium-spa-cat/blob/
> master/dev/testvoc.cat-spa.txt
>
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] cat>spa com>#cómo

2018-04-25 Thread Jaume Ortolà i Font
El dia 25 d’abril de 2018 a les 7:23, Hèctor Alòs i Font <
hectora...@gmail.com> ha escrit:

> Hola Jaume,
>
> Ara se'm fa una mica difícil mirar coses en el cat-spa perquè tinc canvis
> en el cat esperant de pujar quan tanquis la versió. Vaig intentar pujar
> només algunes cosetes de desambiguació, però no vaig veure com fer-ho sense
> pujar també paraules noves.
>
> Exactament, què vols desambiguar en spa>cat? No sembla que hi hagi res a
> desambiguar entre "como" i "cómo". Quant a cat>spa, ja hi ha algunes regles
> per fer-ho (busca 'Com' en el fitxer rlx, en trobaràs cap a la línia 530).
> És un tema complicat perquè els interrogatius no són només en les frases
> amb punt d'interrogació, sinó també, per exemple en "no sé com t'ho fas".
>
> I realment funciona això:
>cómo  com n="itg"/>
> como  com n="adv"/>
> ?
>
> Com tradueix "como"? (spa>cat)
>

Hi ha moltes altres entrades relacionades amb "com" i "com a". És complicat
i no m'he parat a mirar-ho.

Al final he canviat aquesta entrada, afegint-hi "itg":
   cómo  com

He eliminat aquesta (que havia afegit jo):
como  com

I he deixat tota la resta com estava. Amb això desapareix el problema i no
sembla que empitjori res.

Jaume








>
> El dia 25 d’abril de 2018 a les 0:53, Jaume Ortolà i Font <
> jaumeort...@gmail.com> ha escrit:
>
>> He trobat un problema prou important en la traducció cat>spa perquè és
>> una paraula molt comuna.
>>
>> Tots els "com" eren traduïts per "#cómo", perquè el tagger deixava només
>> l'etiqueta . que duia a  aquesta entrada:
>>
>>cómo  com
>>
>> De moment, ho he resolt canviant l'entrada per aquestes dues:
>>
>>cómo  com> n="itg"/>
>> como  com> n="adv"/>
>>
>> Suposo que es podria desambiguar l'interrogatiu quan hi ha interrogants
>> (?) en la frase.
>>
>> M'imagino que ací fallen altres coses (el tagger?). Ho dic per si algú
>> sap com està aquesta qüestió.
>>
>> Salutacions,
>> Jaume Ortolà
>>
>>
>> 
>> --
>> Check out the vibrant tech community on one of the world's most
>> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
>> ___
>> Apertium-catala mailing list
>> Apertium-catala@lists.sourceforge.net
>> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>>
>>
>
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


[Apertium-catala] numerals

2018-04-25 Thread Jaume Ortolà i Font
Bon dia,

He vist que hi havia una petita incongruència en els numerals en català,
que provocava un error en la traducció spa<>cat. Ho hem parlat ací Marc i
jo.

https://github.com/apertium/apertium-cat/commit/
b96379675c5bf59c69752b9db031a865aa764eb8

Mirem quins canvis podem fer que creïn els mínims problemes possibles als
diferents parells de traducció.

El canvi mínim requerit per al català-castellà és que es puguin diferenciar
cardinals i ordinals.

"cinquanta-un/a" vs.   "cinquanta-u"
"cinquanta-dos/dues"  vs.   "cinquanta-dos"

Donant-hi voltes crec que he trobat una solució "mínima", si no volem
començar a etiquetar ordinals i cardinals (ens hauríem d'inventar etiquetes
noves?). Pot estar tot etiquetat com a "numeral", i quan es vulgui la forma
ordinal s'ha de demanar la forma "mf sp".

Els casos típics serien:

cinquanta-u num mf sp (ordinal)
cinquanta-un num m sp
cinquanta-una num f sp

cinquanta-dos num mf sp  (ordinal) (potser r="RL", només síntesi)
cinquanta-dos num m sp
cinquanta-dues num f sp

cinquanta-tres num mf sp (ordinal i cardinal)

cinquanta-un mil num mf sp  (ordinal) (potser r="RL", només síntesi)
cinquanta-un mil num m sp
cinquanta-una mil num f sp

Amb això n'hi hauria prou per a forçar l'ordinal en casos com: pàgina dos,
pàgina cinquanta-u, etc.

Els canvis de gènere s'han de resoldre en els diccionaris bilingües segons
cada llengua. Això és inevitable.

Per una altra part, tenim els ordinals primer, segon..., cinquanta-unè...
Es podrien etiquetar com a adjectius ordinals. Però sembla que no existeix
aquesta etiqueta. La podem crear? Per a mi no és una prioritat.

Finalment, hi ha els numerals com a noms. Ara no els tenim. Se'n podrien
introduir uns quants, per exemple de l'u al 10 o al 20: l'u, els uns, el
dos, els dosos, el tres, els tresos, etc.

Una altra cosa del castellà és que s'usa "cincuenta y un" en lloc de "cincuenta
y uno" si va davant de nom. Per tant, té sentit posar "cincuenta y un" com
a determinant diferent del numeral "cincuenta y uno". Per a aconseguir el
mateix efecte en la traducció cat<>spa segurament cal duplicar
"cinquanta-un" en català com a determinant. Crec que la confusió ha vingut
d'aquí: de voler imitar en català el model castellà i no fer-ho bé del tot.

Jaume
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala