Re: [Apertium-catala] Presentació: Jaume Ortolà

2017-06-08 Thread Jaume Ortolà i Font
El dia 8 de juny de 2017 a les 20:27, Xavi Ivars  ha
escrit:

> Fa vora un any ja vaig parlar amb Gema, Mikel i Fran per a explorar la
> possibilitat aquesta idea (que tu i jo havíem comentat a vegades), però
> probablement en aquell moment jo ho vaig plantejar de manera incorrecta:
> vaig proposar utilitzar el "catalan-dict-tools" com a font de
> l'apertium-cat, i que aquest últim fóra completament autogenerat. Crec que
> va ser Mikel el que va dir que això no era bona idea, ja que no volíem
> perdre l'habilitat de tindre un "apertium-cat" editable.
>
> Crec que la idea aquesta (si ho he entés bé) de fer una aportació puntual
> (o més en el futur, però de manera "controlada" i només quan faça falta)
> pot funcionar molt bé.
>

Sí, jo crec que es tracta d'això, d'afegir coses que falten o de fer
comprovacions. Cada aplicació té les seues necessitats i és molt difícil
que un sol diccionari servisca per a tot.


> Només un comentari: respecte als augmentatius -íssim, segurament el més
> fàcil seria fer un paradigma a Apertium per a gestionar-los (si cal).
>

En Apertium hi ha "bo" i "boníssim" dins d'un sol paradigma. En canvi, jo
els tinc en dos lemes separats. Crec que jo els puc fer dependre fàcilment
del mateix lema, i així minimitzem les diferències.


>  Ara el que caldria fer és el que comenta l'Hèctor: comprovar que els
> adjectius que ja estan a apertium-cat que també has generat tu siguen
> "iguals". No necessàriament que tinguen els mateixos paradigmes, sinó que
> el "lt-expand" és igual.
>

Entesos. Ara ho veig més clar. Una volta eliminada la diferència dels
superlatius, crec que hauria d'encaixar quasi tot, i trobaríem les
possibles incoherències entre diccionaris.


> També caldria veure quins adjectius introdueixen ambigüitat on no n'hi
> havia (per exemple, adjectius que coincideixen amb verbs/noms, i que les
> traduccions podrien ser diferents).
>
> Siga com siga, enhorabona!
>
> Saps d'algun diccionari "semblant" en castellà, anglès o francès? Sé que
> els diccionaris de LT no són tan complets com els de català, però no sé si
> tenen informació suficient per a fer això.
>

Pot servir qualsevol diccionari. Com més gran i de més qualitat, millor. Si
té les formes flexionades, ja tens una part de la feina feta. Si no les té,
doncs es poden crear seguint les regles de la llengua en qüestió. No hi ha
cap altre misteri. De dades disponibles, crec que se'n poden trobar de
sobra. Ara, segons la llengua pot ser més o menys costós d'elaborar.

Salut,
Jaume Ortolà
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


[Apertium-catala] Presentació: Jaume Ortolà

2017-06-08 Thread Jaume Ortolà i Font
Bon dia,

Sóc nou en aquesta llista. Em presente. Em dic Jaume Ortolà, i estic
interessat a col·laborar en Apertium en els parells de traducció que
inclouen el català.

Tinc alguna experiència en Apertium, però no és sistemàtica. Sí que he
treballat molt en altres projectes relacionats amb el català: el corrector
LanguageTool en català [1], i unes eines per a generar diccionaris de
català en diferents formats [2].

Entrant ja en matèria, us explique una de les coses que he fet. He provat
de generar tots els adjectius que tinc en el diccionari en el format
d'Apertium. Funciona sense problemes. El resultat el teniu ací:
https://raw.githubusercontent.com/Softcatala/catalan-dict-to
ols/master/resultats/apertium/adj-languagetool-format-apertium.txt

En el diccionari monolingüe català d'Apertium ara hi ha uns 6.000
adjectius. Jo n'he generat 26.000, i n'han quedat 422 sense paradigma. Amb
alguns retocs aquests 422 es poden reduir prou. Però també n'hi ha molts
que són irregulars i que requeririen un paradigma propi nou en Apertium
(que podem generar automàticament). Hi ha alguna petita diferència en
l'organització dels paradigmes. Jo els augmentatius -íssim els tinc ara en
lemes separats.

Puc fer el mateix amb els noms. En altres categories gramaticals com els
verbs, en principi, no té tant d'interès, més enllà de comprovar
inconsistències entre diccionaris.

En castellà o en altres llengües, es podria intentar fer coses similars.

L'objectiu de tot això és automatitzar al màxim la introducció de paraules
noves en els diccionaris, de manera que puguem destinar el temps a la
revisió dels casos més difícils.

Salutacions,
Jaume Ortolà


[1] https://github.com/languagetool-org/languagetool
[2] https://github.com/Softcatala/catalan-dict-tools
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala