Re: [Apertium-catala] Canvis ortogràfics en català

2018-12-27 Thread Xavi Ivars
Només afegir una cosa respecte als diacrítics: hem multiplicat per 2 la
quantiat de modes, però a diferència del que passa amb els modes que ja
existeixen del valencià, per exemple, en aquest cas no s'augmenta el temps
de compilació. Eixe era una de les coses que voliem assegurar-nos que no
passara, que augmentara massa el temps de compilació.

Missatge de Jaume Ortolà i Font  del dia dt., 25 de
des. 2018 a les 14:05:

> Bon dia,
>
> Us explique els canvis que hem previst i que estem a punt d'implementar
> per a adaptar el traductor als últims canvis ortogràfics de l'IEC (seguits
> després per l'AVL).
>
> Ho dividisc entre diacrítics (dona/dóna) i la resta de canvis (erradicar,
> toroidal, geoestacionari...), perquè el tractament serà diferent.
>
> ** Diacrítics*
> El traductor podrà analitzar i sintetitzar amb la normativa tradicional i
> la nova.
>
> spa-cat = genera la norma tradicional (Em dóna).
> spa-cat_iec2017 = genera la norma nova (Em dona).
>
> Per  a aconseguir això caldrà introduir modes nous en els diccionaris
> bilingües com els que tenim ací, gràcies a Xavi Ivars:
>
> https://github.com/apertium/apertium-spa-cat/commit/1f1ff58d966f1d445f0376fd7a45cfa774b86e44
>
> Els canvis en el diccionari català ja estan preparats en aquesta branca:
> https://github.com/apertium/apertium-cat/commits/diacritics
>
> Està quasi tot a punt. Només caldrà millorar una mica la desambiguació en
> unes poques paraules més difícils (dona, soc, net, fora...). De moment això
> no serà gaire necessari. Farà més falta en la mesura que aquestes grafies
> es facen més comunes.
>
> A part dels modes, no caldrà canviar res més en els bilingües.
>
> ** Altres canvis: erradicar, toroidal, geoestacionari...*
>
> La forma ortogràfica nova la deixarem com la principal. L'antiga quedarà
> com a secundària, només per a anàlisi, marcada com a r="LR". Això vol dir
> que caldrà introduir canvis en tots els diccionaris bilingües. Fins que no
> s'arregle, apareixeran errors de testvoc. Per exemple, caldrà canviar
> "eradicar" per "erradicar", "toroïdal" per "toroidal", etc. Faré una llista
> amb tot el que canviem en el bilingüe català perquè ho tingueu a mà.
>
> Salutacions,
> Jaume Ortolà
>
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>


-- 
< Xavi Ivars >
< http://xavi.ivars.me >
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


[Apertium-catala] Canvis ortogràfics en català

2018-12-25 Thread Jaume Ortolà i Font
Bon dia,

Us explique els canvis que hem previst i que estem a punt d'implementar per
a adaptar el traductor als últims canvis ortogràfics de l'IEC (seguits
després per l'AVL).

Ho dividisc entre diacrítics (dona/dóna) i la resta de canvis (erradicar,
toroidal, geoestacionari...), perquè el tractament serà diferent.

** Diacrítics*
El traductor podrà analitzar i sintetitzar amb la normativa tradicional i
la nova.

spa-cat = genera la norma tradicional (Em dóna).
spa-cat_iec2017 = genera la norma nova (Em dona).

Per  a aconseguir això caldrà introduir modes nous en els diccionaris
bilingües com els que tenim ací, gràcies a Xavi Ivars:
https://github.com/apertium/apertium-spa-cat/commit/1f1ff58d966f1d445f0376fd7a45cfa774b86e44

Els canvis en el diccionari català ja estan preparats en aquesta branca:
https://github.com/apertium/apertium-cat/commits/diacritics

Està quasi tot a punt. Només caldrà millorar una mica la desambiguació en
unes poques paraules més difícils (dona, soc, net, fora...). De moment això
no serà gaire necessari. Farà més falta en la mesura que aquestes grafies
es facen més comunes.

A part dels modes, no caldrà canviar res més en els bilingües.

** Altres canvis: erradicar, toroidal, geoestacionari...*

La forma ortogràfica nova la deixarem com la principal. L'antiga quedarà
com a secundària, només per a anàlisi, marcada com a r="LR". Això vol dir
que caldrà introduir canvis en tots els diccionaris bilingües. Fins que no
s'arregle, apareixeran errors de testvoc. Per exemple, caldrà canviar
"eradicar" per "erradicar", "toroïdal" per "toroidal", etc. Faré una llista
amb tot el que canviem en el bilingüe català perquè ho tingueu a mà.

Salutacions,
Jaume Ortolà
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] canvis ortogràfics en català

2018-08-18 Thread Jaume Ortolà i Font
Missatge de Mikel L. Forcada  del dia ds., 18 d’ag. 2018 a
les 18:00:

> Això està molt bé, Xavi, per a generar. Així no hi ha problemes amb
> proliferació de variants. L'anàlisi, com la faríem finalment?
>
>
Com vaig dir al principi.

La majoria de paraules remetran a la paraula que duia diacrític en el
mateix monolingüe :
adeu -> adéu
subsol -> subsòl
rebesnet -> rebesnét
...

Però per a les paraules 5 o 6 paraules "difícils" (dona, venen, os, net,
soc...) caldrà mirar-ho cas per cas i veure si es pot desambiguar amb
Constraint Grammar.

Jo he provat un poc amb "dona". No es poden fer miracles. Caldria
analitzar-la com a verb quan està prou clar pel context: (dona'ns, li dona,
us la dona, dona lloc/ajuda/sang, que dona a, dona a entendre, etc.), i en
la resta de casos serà nom. Perquè tampoc no volem degradar massa els
resultats dels qui fan servir el diacrític tradicional (dóna).

Jaume

Mikel
>
> El 17/08/18 a les 13:30, Xavi Ivars ha escrit:
>
> He estat treballant en un nou mòdul per tal d'integrar els nous
> diacrítics. He creat tres modes mes (cat_novaortografia,
> cat_val_uni_novaortografia i cat_val_gva_novaortografia), però no es
> compilen nous diccionaris monolingües ni bilingües, només un petit
> "postgen" nou.
>
> Però calia un nou mòdul que s'aplicarà entre la generació i la
> post-generació (l'he anomenat "inter-generació" :P) La idea és que això
> permetrà fer "post-generació" en N fases, semblant al que es fa amb els
> interchunks i postchunks amb el transfer.
>
> En aquest cas, en una primera fase de post-generació (que no s'executarà
> si utilitzem els modes clàssics, amb l'ortografia clàssica), es faran els
> canvis ortogràfics. Després es farà la fase de post-generació actual, que
> té en compte coses com apostrofació, em -> me,...
>
>
> Missatge de Hèctor Alòs i Font  del dia dt., 31 de
> jul. 2018 a les 12:01:
>
>> I com està el tema de fer portables les regles de desambiguació amb CG en
>> els entorns en què, si no m'equivoco, no funcionen? Tot plegat, aquests
>> canvis encara donaran més pes a la desambiguació amb CG i faran que baixi
>> la qualitat de les traduccions en els entorns/aplicacions on CG no es pugui
>> utilitzar.
>>
>> El dia 31 de juliol de 2018 a les 11:52, Marc Riera Irigoyen <
>> marc.riera.irigo...@gmail.com> ha escrit:
>>
>>> Bon dia,
>>>
>>> Com ha dit en Xavi, si mantenim les formes actuals com a principals no
>>> només evitem haver de propagar canvis a tots els diccionaris bilingües (que
>>> en el fons no és tanta feina, però hi hauríem de dedicar una estona), sinó
>>> haver de crear "pseudolemes" com "mango_fruta" al diccionari. A més, els
>>> diacrítics que hem tingut fins ara ens beneficien a nivell de
>>> desambiguació, i segurament tinguem millors resultats així que amb les
>>> formes noves.
>>>
>>> Això pareix molt d'embolic. Si tu dius que és viable...
 Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals
 (o l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
 perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
 siga comentant part del codi i fix per a cada instal·lació d'Apertium.
>>>
>>>
>>> Això dels modes sembla un embolic a primera vista, però és simplement el
>>> funcionament intern d'Apertium, la manera que té de representar diferents
>>> parells (o en aquest cas, variants dins d'un mateix parell). Que per a
>>> l'usuari sigui més o menys difícil de fer servir dependrà de com es
>>> reprodueixi a la interfície. Personalment, seria partidari de mantenir al
>>> desplegable de la web les variants geogràfiques i afegir una casella
>>> independent a la part inferior (com es fa actualment a LanguageTool) per
>>> decidir el model de generació. No sóc jo qui s'encarrega de la interfície
>>> web, però fins on sé, es podria fer.
>>>
>>> *Marc Riera*
>>>
>>>
>>> Missatge de Xavi Ivars  del dia dv., 27 de jul.
>>> 2018 a les 21:17:
>>>


 Missatge de Jaume Ortolà i Font  del dia dj.,
 26 de jul. 2018 a les 23:03:

> Abans m'he descuidat un punt dels canvis ortogràfics: la dièresi
> (romboïdal > romboidal). Ho faria igual que amb la e epentètica.
>
> La meua proposta ve de la valoració personal que faig dels canvis, i
> per tant és subjectiva i discutible.
>
> Els canvis de la e, la erra i la dièresi em semblen positius (o
> indiferents). Per això, propose adoptar-los plenament (i posar-los en els
> bilingües) i no calfar-nos més el cap. No crec que hagen de mantenir-se 
> com
> a opció. No val la pena.
>
> Amb els diacrítics és diferent. Voldria que hi hagués la possibilitat
> de generar text amb la norma tradicional.
>
> Missatge de Xavi Ivars  del dia dj., 26 de jul.
> 2018 a les 19:54:
>
>> El que passarà és que, tot i que els canvis siguen només a la
>> post-edició, si que hi haurà una explosió de modes si volem "permetre" 
>> que
>> es puga fer qualsevol cosa.
>> * ca

Re: [Apertium-catala] canvis ortogràfics en català

2018-08-18 Thread Mikel L. Forcada
Això està molt bé, Xavi, per a generar. Així no hi ha problemes amb 
proliferació de variants. L'anàlisi, com la faríem finalment?


Mikel


El 17/08/18 a les 13:30, Xavi Ivars ha escrit:
He estat treballant en un nou mòdul per tal d'integrar els nous 
diacrítics. He creat tres modes mes (cat_novaortografia, 
cat_val_uni_novaortografia i cat_val_gva_novaortografia), però no es 
compilen nous diccionaris monolingües ni bilingües, només un petit 
"postgen" nou.


Però calia un nou mòdul que s'aplicarà entre la generació i la 
post-generació (l'he anomenat "inter-generació" :P) La idea és que 
això permetrà fer "post-generació" en N fases, semblant al que es fa 
amb els interchunks i postchunks amb el transfer.


En aquest cas, en una primera fase de post-generació (que no 
s'executarà si utilitzem els modes clàssics, amb l'ortografia 
clàssica), es faran els canvis ortogràfics. Després es farà la fase de 
post-generació actual, que té en compte coses com apostrofació, em -> 
me,...



Missatge de Hèctor Alòs i Font > del dia dt., 31 de jul. 2018 a les 12:01:


I com està el tema de fer portables les regles de desambiguació
amb CG en els entorns en què, si no m'equivoco, no funcionen? Tot
plegat, aquests canvis encara donaran més pes a la desambiguació
amb CG i faran que baixi la qualitat de les traduccions en els
entorns/aplicacions on CG no es pugui utilitzar.

El dia 31 de juliol de 2018 a les 11:52, Marc Riera Irigoyen
mailto:marc.riera.irigo...@gmail.com>> ha escrit:

Bon dia,

Com ha dit en Xavi, si mantenim les formes actuals com a
principals no només evitem haver de propagar canvis a tots els
diccionaris bilingües (que en el fons no és tanta feina, però
hi hauríem de dedicar una estona), sinó haver de crear
"pseudolemes" com "mango_fruta" al diccionari. A més, els
diacrítics que hem tingut fins ara ens beneficien a nivell de
desambiguació, i segurament tinguem millors resultats així que
amb les formes noves.

Això pareix molt d'embolic. Si tu dius que és viable...
Com a usuari voldria que hi hagués l'opció diacrítics
nous/tradicionals (o l'opció d'accentuació cafè/café). Si
es pot donar l'opció a l'usuari, perfecte. Si no, que com
a mínim es puga fer d'alguna manera, encara que siga
comentant part del codi i fix per a cada instal·lació
d'Apertium.


Això dels modes sembla un embolic a primera vista, però és
simplement el funcionament intern d'Apertium, la manera que té
de representar diferents parells (o en aquest cas, variants
dins d'un mateix parell). Que per a l'usuari sigui més o menys
difícil de fer servir dependrà de com es reprodueixi a la
interfície. Personalment, seria partidari de mantenir al
desplegable de la web les variants geogràfiques i afegir una
casella independent a la part inferior (com es fa actualment a
LanguageTool) per decidir el model de generació. No sóc jo qui
s'encarrega de la interfície web, però fins on sé, es podria fer.

*Marc Riera*


Missatge de Xavi Ivars mailto:xavi.iv...@gmail.com>> del dia dv., 27 de jul. 2018 a
les 21:17:



Missatge de Jaume Ortolà i Font mailto:jaumeort...@gmail.com>> del dia dj., 26 de jul.
2018 a les 23:03:

Abans m'he descuidat un punt dels canvis ortogràfics:
la dièresi (romboïdal > romboidal). Ho faria igual que
amb la e epentètica.

La meua proposta ve de la valoració personal que faig
dels canvis, i per tant és subjectiva i discutible.

Els canvis de la e, la erra i la dièresi em semblen
positius (o indiferents). Per això, propose
adoptar-los plenament (i posar-los en els bilingües) i
no calfar-nos més el cap. No crec que hagen de
mantenir-se com a opció. No val la pena.

Amb els diacrítics és diferent. Voldria que hi hagués
la possibilitat de generar text amb la norma tradicional.

Missatge de Xavi Ivars mailto:xavi.iv...@gmail.com>> del dia dj., 26 de jul.
2018 a les 19:54:

El que passarà és que, tot i que els canvis siguen
només a la post-edició, si que hi haurà una
explosió de modes si volem "permetre" que es puga
fer qualsevol cosa.
* cat
* cat_val_uni
* cat_val_gva
* cat_nova
* cat_val_uni_nova
* cat_val_gva_nova


Això pareix molt d'embolic. Si tu dius que és viable...

Com a usuari voldria que hi hagués l'opció diacrítics
nous/tradi

Re: [Apertium-catala] canvis ortogràfics en català

2018-08-17 Thread Xavi Ivars
He estat treballant en un nou mòdul per tal d'integrar els nous diacrítics.
He creat tres modes mes (cat_novaortografia, cat_val_uni_novaortografia i
cat_val_gva_novaortografia), però no es compilen nous diccionaris
monolingües ni bilingües, només un petit "postgen" nou.

Però calia un nou mòdul que s'aplicarà entre la generació i la
post-generació (l'he anomenat "inter-generació" :P) La idea és que això
permetrà fer "post-generació" en N fases, semblant al que es fa amb els
interchunks i postchunks amb el transfer.

En aquest cas, en una primera fase de post-generació (que no s'executarà si
utilitzem els modes clàssics, amb l'ortografia clàssica), es faran els
canvis ortogràfics. Després es farà la fase de post-generació actual, que
té en compte coses com apostrofació, em -> me,...


Missatge de Hèctor Alòs i Font  del dia dt., 31 de
jul. 2018 a les 12:01:

> I com està el tema de fer portables les regles de desambiguació amb CG en
> els entorns en què, si no m'equivoco, no funcionen? Tot plegat, aquests
> canvis encara donaran més pes a la desambiguació amb CG i faran que baixi
> la qualitat de les traduccions en els entorns/aplicacions on CG no es pugui
> utilitzar.
>
> El dia 31 de juliol de 2018 a les 11:52, Marc Riera Irigoyen <
> marc.riera.irigo...@gmail.com> ha escrit:
>
>> Bon dia,
>>
>> Com ha dit en Xavi, si mantenim les formes actuals com a principals no
>> només evitem haver de propagar canvis a tots els diccionaris bilingües (que
>> en el fons no és tanta feina, però hi hauríem de dedicar una estona), sinó
>> haver de crear "pseudolemes" com "mango_fruta" al diccionari. A més, els
>> diacrítics que hem tingut fins ara ens beneficien a nivell de
>> desambiguació, i segurament tinguem millors resultats així que amb les
>> formes noves.
>>
>> Això pareix molt d'embolic. Si tu dius que és viable...
>>> Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals
>>> (o l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
>>> perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
>>> siga comentant part del codi i fix per a cada instal·lació d'Apertium.
>>
>>
>> Això dels modes sembla un embolic a primera vista, però és simplement el
>> funcionament intern d'Apertium, la manera que té de representar diferents
>> parells (o en aquest cas, variants dins d'un mateix parell). Que per a
>> l'usuari sigui més o menys difícil de fer servir dependrà de com es
>> reprodueixi a la interfície. Personalment, seria partidari de mantenir al
>> desplegable de la web les variants geogràfiques i afegir una casella
>> independent a la part inferior (com es fa actualment a LanguageTool) per
>> decidir el model de generació. No sóc jo qui s'encarrega de la interfície
>> web, però fins on sé, es podria fer.
>>
>> *Marc Riera*
>>
>>
>> Missatge de Xavi Ivars  del dia dv., 27 de jul.
>> 2018 a les 21:17:
>>
>>>
>>>
>>> Missatge de Jaume Ortolà i Font  del dia dj., 26
>>> de jul. 2018 a les 23:03:
>>>
 Abans m'he descuidat un punt dels canvis ortogràfics: la dièresi
 (romboïdal > romboidal). Ho faria igual que amb la e epentètica.

 La meua proposta ve de la valoració personal que faig dels canvis, i
 per tant és subjectiva i discutible.

 Els canvis de la e, la erra i la dièresi em semblen positius (o
 indiferents). Per això, propose adoptar-los plenament (i posar-los en els
 bilingües) i no calfar-nos més el cap. No crec que hagen de mantenir-se com
 a opció. No val la pena.

 Amb els diacrítics és diferent. Voldria que hi hagués la possibilitat
 de generar text amb la norma tradicional.

 Missatge de Xavi Ivars  del dia dj., 26 de jul.
 2018 a les 19:54:

> El que passarà és que, tot i que els canvis siguen només a la
> post-edició, si que hi haurà una explosió de modes si volem "permetre" que
> es puga fer qualsevol cosa.
> * cat
> * cat_val_uni
> * cat_val_gva
> * cat_nova
> * cat_val_uni_nova
> * cat_val_gva_nova
>

 Això pareix molt d'embolic. Si tu dius que és viable...

 Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals
 (o l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
 perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
 siga comentant part del codi i fix per a cada instal·lació d'Apertium.

>>>
>>> Sembla més complicat del que és. Es tracta de fer "modes" que,
>>> simplement, afegisquen un pas al final per a eliminar els diacrítics. I com
>>> que el pas seria el maaateix per a totes les "variants", la compilació
>>> només augmentaria en un únic fitxer "post-dix" idèntic per a tots.
>>>
>>> Puc encarregar-me de "preparar-ho".
>>> --
>>> < Xavi Ivars >
>>> < http://xavi.ivars.me >
>>>
>>> --
>>> Check out the vibrant tech community on one of the world's most
>>> engaging tech sites, Slash

Re: [Apertium-catala] canvis ortogràfics en català

2018-07-31 Thread Hèctor Alòs i Font
I com està el tema de fer portables les regles de desambiguació amb CG en
els entorns en què, si no m'equivoco, no funcionen? Tot plegat, aquests
canvis encara donaran més pes a la desambiguació amb CG i faran que baixi
la qualitat de les traduccions en els entorns/aplicacions on CG no es pugui
utilitzar.

El dia 31 de juliol de 2018 a les 11:52, Marc Riera Irigoyen <
marc.riera.irigo...@gmail.com> ha escrit:

> Bon dia,
>
> Com ha dit en Xavi, si mantenim les formes actuals com a principals no
> només evitem haver de propagar canvis a tots els diccionaris bilingües (que
> en el fons no és tanta feina, però hi hauríem de dedicar una estona), sinó
> haver de crear "pseudolemes" com "mango_fruta" al diccionari. A més, els
> diacrítics que hem tingut fins ara ens beneficien a nivell de
> desambiguació, i segurament tinguem millors resultats així que amb les
> formes noves.
>
> Això pareix molt d'embolic. Si tu dius que és viable...
>> Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals
>> (o l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
>> perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
>> siga comentant part del codi i fix per a cada instal·lació d'Apertium.
>
>
> Això dels modes sembla un embolic a primera vista, però és simplement el
> funcionament intern d'Apertium, la manera que té de representar diferents
> parells (o en aquest cas, variants dins d'un mateix parell). Que per a
> l'usuari sigui més o menys difícil de fer servir dependrà de com es
> reprodueixi a la interfície. Personalment, seria partidari de mantenir al
> desplegable de la web les variants geogràfiques i afegir una casella
> independent a la part inferior (com es fa actualment a LanguageTool) per
> decidir el model de generació. No sóc jo qui s'encarrega de la interfície
> web, però fins on sé, es podria fer.
>
> *Marc Riera*
>
>
> Missatge de Xavi Ivars  del dia dv., 27 de jul.
> 2018 a les 21:17:
>
>>
>>
>> Missatge de Jaume Ortolà i Font  del dia dj., 26
>> de jul. 2018 a les 23:03:
>>
>>> Abans m'he descuidat un punt dels canvis ortogràfics: la dièresi
>>> (romboïdal > romboidal). Ho faria igual que amb la e epentètica.
>>>
>>> La meua proposta ve de la valoració personal que faig dels canvis, i per
>>> tant és subjectiva i discutible.
>>>
>>> Els canvis de la e, la erra i la dièresi em semblen positius (o
>>> indiferents). Per això, propose adoptar-los plenament (i posar-los en els
>>> bilingües) i no calfar-nos més el cap. No crec que hagen de mantenir-se com
>>> a opció. No val la pena.
>>>
>>> Amb els diacrítics és diferent. Voldria que hi hagués la possibilitat de
>>> generar text amb la norma tradicional.
>>>
>>> Missatge de Xavi Ivars  del dia dj., 26 de jul.
>>> 2018 a les 19:54:
>>>
 El que passarà és que, tot i que els canvis siguen només a la
 post-edició, si que hi haurà una explosió de modes si volem "permetre" que
 es puga fer qualsevol cosa.
 * cat
 * cat_val_uni
 * cat_val_gva
 * cat_nova
 * cat_val_uni_nova
 * cat_val_gva_nova

>>>
>>> Això pareix molt d'embolic. Si tu dius que és viable...
>>>
>>> Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals
>>> (o l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
>>> perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
>>> siga comentant part del codi i fix per a cada instal·lació d'Apertium.
>>>
>>
>> Sembla més complicat del que és. Es tracta de fer "modes" que,
>> simplement, afegisquen un pas al final per a eliminar els diacrítics. I com
>> que el pas seria el maaateix per a totes les "variants", la compilació
>> només augmentaria en un únic fitxer "post-dix" idèntic per a tots.
>>
>> Puc encarregar-me de "preparar-ho".
>> --
>> < Xavi Ivars >
>> < http://xavi.ivars.me >
>> 
>> --
>> Check out the vibrant tech community on one of the world's most
>> engaging tech sites, Slashdot.org! http://sdm.link/slashdot__
>> _
>> Apertium-catala mailing list
>> Apertium-catala@lists.sourceforge.net
>> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>>
>
> 
> --
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
>
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net

Re: [Apertium-catala] canvis ortogràfics en català

2018-07-31 Thread Marc Riera Irigoyen
Bon dia,

Com ha dit en Xavi, si mantenim les formes actuals com a principals no
només evitem haver de propagar canvis a tots els diccionaris bilingües (que
en el fons no és tanta feina, però hi hauríem de dedicar una estona), sinó
haver de crear "pseudolemes" com "mango_fruta" al diccionari. A més, els
diacrítics que hem tingut fins ara ens beneficien a nivell de
desambiguació, i segurament tinguem millors resultats així que amb les
formes noves.

Això pareix molt d'embolic. Si tu dius que és viable...
> Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals (o
> l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
> perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
> siga comentant part del codi i fix per a cada instal·lació d'Apertium.


Això dels modes sembla un embolic a primera vista, però és simplement el
funcionament intern d'Apertium, la manera que té de representar diferents
parells (o en aquest cas, variants dins d'un mateix parell). Que per a
l'usuari sigui més o menys difícil de fer servir dependrà de com es
reprodueixi a la interfície. Personalment, seria partidari de mantenir al
desplegable de la web les variants geogràfiques i afegir una casella
independent a la part inferior (com es fa actualment a LanguageTool) per
decidir el model de generació. No sóc jo qui s'encarrega de la interfície
web, però fins on sé, es podria fer.

*Marc Riera*


Missatge de Xavi Ivars  del dia dv., 27 de jul. 2018
a les 21:17:

>
>
> Missatge de Jaume Ortolà i Font  del dia dj., 26
> de jul. 2018 a les 23:03:
>
>> Abans m'he descuidat un punt dels canvis ortogràfics: la dièresi
>> (romboïdal > romboidal). Ho faria igual que amb la e epentètica.
>>
>> La meua proposta ve de la valoració personal que faig dels canvis, i per
>> tant és subjectiva i discutible.
>>
>> Els canvis de la e, la erra i la dièresi em semblen positius (o
>> indiferents). Per això, propose adoptar-los plenament (i posar-los en els
>> bilingües) i no calfar-nos més el cap. No crec que hagen de mantenir-se com
>> a opció. No val la pena.
>>
>> Amb els diacrítics és diferent. Voldria que hi hagués la possibilitat de
>> generar text amb la norma tradicional.
>>
>> Missatge de Xavi Ivars  del dia dj., 26 de jul.
>> 2018 a les 19:54:
>>
>>> El que passarà és que, tot i que els canvis siguen només a la
>>> post-edició, si que hi haurà una explosió de modes si volem "permetre" que
>>> es puga fer qualsevol cosa.
>>> * cat
>>> * cat_val_uni
>>> * cat_val_gva
>>> * cat_nova
>>> * cat_val_uni_nova
>>> * cat_val_gva_nova
>>>
>>
>> Això pareix molt d'embolic. Si tu dius que és viable...
>>
>> Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals
>> (o l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
>> perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
>> siga comentant part del codi i fix per a cada instal·lació d'Apertium.
>>
>
> Sembla més complicat del que és. Es tracta de fer "modes" que, simplement,
> afegisquen un pas al final per a eliminar els diacrítics. I com que el pas
> seria el maaateix per a totes les "variants", la compilació només
> augmentaria en un únic fitxer "post-dix" idèntic per a tots.
>
> Puc encarregar-me de "preparar-ho".
> --
> < Xavi Ivars >
> < http://xavi.ivars.me >
>
> --
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] canvis ortogràfics en català

2018-07-27 Thread Xavi Ivars
Missatge de Jaume Ortolà i Font  del dia dj., 26 de
jul. 2018 a les 23:03:

> Abans m'he descuidat un punt dels canvis ortogràfics: la dièresi
> (romboïdal > romboidal). Ho faria igual que amb la e epentètica.
>
> La meua proposta ve de la valoració personal que faig dels canvis, i per
> tant és subjectiva i discutible.
>
> Els canvis de la e, la erra i la dièresi em semblen positius (o
> indiferents). Per això, propose adoptar-los plenament (i posar-los en els
> bilingües) i no calfar-nos més el cap. No crec que hagen de mantenir-se com
> a opció. No val la pena.
>
> Amb els diacrítics és diferent. Voldria que hi hagués la possibilitat de
> generar text amb la norma tradicional.
>
> Missatge de Xavi Ivars  del dia dj., 26 de jul.
> 2018 a les 19:54:
>
>> El que passarà és que, tot i que els canvis siguen només a la
>> post-edició, si que hi haurà una explosió de modes si volem "permetre" que
>> es puga fer qualsevol cosa.
>> * cat
>> * cat_val_uni
>> * cat_val_gva
>> * cat_nova
>> * cat_val_uni_nova
>> * cat_val_gva_nova
>>
>
> Això pareix molt d'embolic. Si tu dius que és viable...
>
> Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals (o
> l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
> perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
> siga comentant part del codi i fix per a cada instal·lació d'Apertium.
>

Sembla més complicat del que és. Es tracta de fer "modes" que, simplement,
afegisquen un pas al final per a eliminar els diacrítics. I com que el pas
seria el maaateix per a totes les "variants", la compilació només
augmentaria en un únic fitxer "post-dix" idèntic per a tots.

Puc encarregar-me de "preparar-ho".
-- 
< Xavi Ivars >
< http://xavi.ivars.me >
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] canvis ortogràfics en català

2018-07-27 Thread Hèctor Alòs i Font
Jo, sobretot, us pregaria justament de vigilar molt el no multiplicar
el temps de compilació, Ara mateix, ja el trobo considerable (i la
majoria de vegades innecessari en desenvolupament).
Hèctor

El dia 26/7/18, Xavi Ivars  ha escrit:
> A mi a priori em sembla una bona estratègia. No estic convençut de què és
> millor, si mantenir la forma antiga als bilingües o la nova, però supose
> que millor la antiga (sobretot per a no fer os_esquelet i os_animal com hem
> hagut de fer amb mango_fruta en castellà).
>
> El que passarà és que, tot i que els canvis siguen només a la post-edició,
> si que hi haurà una explosió de modes si volem "permetre" que es puga fer
> qualsevol cosa.
> * cat
> * cat_val_uni
> * cat_val_gva
> * cat_nova
> * cat_val_uni_nova
> * cat_val_gva_nova
>
> Això, a priori, no és cap inconvenient (no estem parlant de multiplicar el
> temps de compilació ni res semblant com si s'afegís una nova variant real
> als diccionaris), però ho hem de tenir en compte.
>
>
>
> Missatge de Mikel L. Forcada  del dia dj., 26 de jul. 2018
> a les 19:39:
>
>> Hola,
>>
>> entre les línies de Jaume:
>>
>>
>> Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a
>> Apertium, us faig cinc cèntims del que he pensat que seria més convenient
>> fer.
>>
>> * Canvis de e epentètica i erra
>>
>> Suposant que donem per bons els canvis, aquí no hi ha complicació. Es
>> tractaria de fer entrades com aquesta:
>>
>> bacterioestàti> n="acadèmi/c__adj"/>
>> > lm="bacteriostàtic">bacteriostàtibacterioestàti> n=" acadèmi/c__adj "/>
>>
>> En els bilingües faríem servir només la forma nova. Així tindríem
>> l'anàlisi en les dues formes i la síntesi en la forma nova.
>>
>> Jo, com a resistència simbòlica, mantindria les versions de l'ortografia
>> antiga en el bilingüe, i tractaria les coses al nivell del monolingüe.
>> Així
>> només hem de canviar apertium-cat , no?
>>
>>
>> * Diacrítics.
>>
>> En els diacrítics la cosa es complica una mica més, però no gaire.
>>
>> Pel que fa a generar text en català:
>>
>> Jo procuraria mantenir la capacitat de generar text segons la norma
>> tradicional, a part de la nova. Internament ho deixaria tot com està, i
>> intentaria fer el pas a les noves normes de diacrítics en la postedició
>> (en
>> apertium:-cat.post-cat.dix). Només caldria posar-hi la llista de paraules
>> que canvien. Així hi hauria la possibilitat de generar amb un sistema i
>> amb
>> l'altre encara que fos tocant el codi.
>>
>> Una opció com les geogràfiques?
>>
>>
>> Pel que fa a l'anàlisi de català:
>>
>> La majoria de casos de diacrítics s'haurien de tractar igual que hem dit
>> que tractaríem els canvis de e epentètica i de erra, però agafant la
>> forma tradicional amb accent com a prioritària. Això passaria amb els
>> composts (adéu, subsòl, etc.).
>>
>> Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi
>> del català admetria la nova versió sense diacrítics com una opció més.
>> Són
>> 140 entrades.
>>
>> Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou
>> dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es
>> podria
>> resoldre amb bons percentatges d'encert (igual que hem fet en castellà
>> per
>> a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...).
>>
>> I després queden paraules que són tan rares que no cal ni considerar-les
>> (cóm, vénda, etc.).
>>
>> Collins, he hagut de mirar "vénda". Estos eivissencs...
>>
>> Que en diu la resta dels apertiumers catalaners?
>>
>> Salut!
>>
>> Mikel
>>
>>
>>
>> Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me
>> si ho faríeu així o d'una altra manera.
>>
>> Salutacions,
>> Jaume Ortolà
>>
>>
>>
>> --
>> Check out the vibrant tech community on one of the world's most
>> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
>>
>>
>>
>> ___
>> Apertium-catala mailing
>> listApertium-catala@lists.sourceforge.nethttps://lists.sourceforge.net/lists/listinfo/apertium-catala
>>
>>
>> --
>> Mikel L. Forcada  http://www.dlsi.ua.es/~mlf/
>> Departament de Llenguatges i Sistemes Informàtics
>> Universitat d'Alacant
>> E-03690 Sant Vicent del Raspeig
>> Spain
>> Office: +34 96 590 9776
>>
>>
>> --
>> Check out the vibrant tech community on one of the world's most
>> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
>> ___
>> Apertium-catala mailing list
>> Apertium-catala@lists.sourceforge.net
>> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>>
>
>
> --
> < Xavi Ivars >
> < http://xavi.ivars.me >
>

--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot

Re: [Apertium-catala] canvis ortogràfics en català

2018-07-27 Thread Jaume Ortolà i Font
Abans m'he descuidat un punt dels canvis ortogràfics: la dièresi (romboïdal
> romboidal). Ho faria igual que amb la e epentètica.

La meua proposta ve de la valoració personal que faig dels canvis, i per
tant és subjectiva i discutible.

Els canvis de la e, la erra i la dièresi em semblen positius (o
indiferents). Per això, propose adoptar-los plenament (i posar-los en els
bilingües) i no calfar-nos més el cap. No crec que hagen de mantenir-se com
a opció. No val la pena.

Amb els diacrítics és diferent. Voldria que hi hagués la possibilitat de
generar text amb la norma tradicional.

Missatge de Xavi Ivars  del dia dj., 26 de jul. 2018
a les 19:54:

> El que passarà és que, tot i que els canvis siguen només a la post-edició,
> si que hi haurà una explosió de modes si volem "permetre" que es puga fer
> qualsevol cosa.
> * cat
> * cat_val_uni
> * cat_val_gva
> * cat_nova
> * cat_val_uni_nova
> * cat_val_gva_nova
>

Això pareix molt d'embolic. Si tu dius que és viable...

Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals (o
l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
siga comentant part del codi i fix per a cada instal·lació d'Apertium.

Jaume
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] canvis ortogràfics en català

2018-07-26 Thread Xavi Ivars
A mi a priori em sembla una bona estratègia. No estic convençut de què és
millor, si mantenir la forma antiga als bilingües o la nova, però supose
que millor la antiga (sobretot per a no fer os_esquelet i os_animal com hem
hagut de fer amb mango_fruta en castellà).

El que passarà és que, tot i que els canvis siguen només a la post-edició,
si que hi haurà una explosió de modes si volem "permetre" que es puga fer
qualsevol cosa.
* cat
* cat_val_uni
* cat_val_gva
* cat_nova
* cat_val_uni_nova
* cat_val_gva_nova

Això, a priori, no és cap inconvenient (no estem parlant de multiplicar el
temps de compilació ni res semblant com si s'afegís una nova variant real
als diccionaris), però ho hem de tenir en compte.



Missatge de Mikel L. Forcada  del dia dj., 26 de jul. 2018
a les 19:39:

> Hola,
>
> entre les línies de Jaume:
>
>
> Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a
> Apertium, us faig cinc cèntims del que he pensat que seria més convenient
> fer.
>
> * Canvis de e epentètica i erra
>
> Suposant que donem per bons els canvis, aquí no hi ha complicació. Es
> tractaria de fer entrades com aquesta:
>
> bacterioestàti n="acadèmi/c__adj"/>
>  lm="bacteriostàtic">bacteriostàtibacterioestàti n=" acadèmi/c__adj "/>
>
> En els bilingües faríem servir només la forma nova. Així tindríem
> l'anàlisi en les dues formes i la síntesi en la forma nova.
>
> Jo, com a resistència simbòlica, mantindria les versions de l'ortografia
> antiga en el bilingüe, i tractaria les coses al nivell del monolingüe. Així
> només hem de canviar apertium-cat , no?
>
>
> * Diacrítics.
>
> En els diacrítics la cosa es complica una mica més, però no gaire.
>
> Pel que fa a generar text en català:
>
> Jo procuraria mantenir la capacitat de generar text segons la norma
> tradicional, a part de la nova. Internament ho deixaria tot com està, i
> intentaria fer el pas a les noves normes de diacrítics en la postedició (en
> apertium:-cat.post-cat.dix). Només caldria posar-hi la llista de paraules
> que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb
> l'altre encara que fos tocant el codi.
>
> Una opció com les geogràfiques?
>
>
> Pel que fa a l'anàlisi de català:
>
> La majoria de casos de diacrítics s'haurien de tractar igual que hem dit
> que tractaríem els canvis de e epentètica i de erra, però agafant la
> forma tradicional amb accent com a prioritària. Això passaria amb els
> composts (adéu, subsòl, etc.).
>
> Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi
> del català admetria la nova versió sense diacrítics com una opció més. Són
> 140 entrades.
>
> Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou
> dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria
> resoldre amb bons percentatges d'encert (igual que hem fet en castellà per
> a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...).
>
> I després queden paraules que són tan rares que no cal ni considerar-les
> (cóm, vénda, etc.).
>
> Collins, he hagut de mirar "vénda". Estos eivissencs...
>
> Que en diu la resta dels apertiumers catalaners?
>
> Salut!
>
> Mikel
>
>
>
> Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me
> si ho faríeu així o d'una altra manera.
>
> Salutacions,
> Jaume Ortolà
>
>
>
> --
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
>
>
>
> ___
> Apertium-catala mailing 
> listApertium-catala@lists.sourceforge.nethttps://lists.sourceforge.net/lists/listinfo/apertium-catala
>
>
> --
> Mikel L. Forcada  http://www.dlsi.ua.es/~mlf/
> Departament de Llenguatges i Sistemes Informàtics
> Universitat d'Alacant
> E-03690 Sant Vicent del Raspeig
> Spain
> Office: +34 96 590 9776
>
>
> --
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>


-- 
< Xavi Ivars >
< http://xavi.ivars.me >
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] canvis ortogràfics en català

2018-07-26 Thread Mikel L. Forcada

Hola,

entre les línies de Jaume:



Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a 
Apertium, us faig cinc cèntims del que he pensat que seria més 
convenient fer.


* Canvis de e epentètica i erra

Suposant que donem per bons els canvis, aquí no hi ha complicació. Es 
tractaria de fer entrades com aquesta:


 bacterioestàtin="acadèmi/c__adj"/>
lm="bacteriostàtic">bacteriostàtibacterioestàtin=" acadèmi/c__adj "/>


En els bilingües faríem servir només la forma nova. Així tindríem 
l'anàlisi en les dues formes i la síntesi en la forma nova.


Jo, com a resistència simbòlica, mantindria les versions de l'ortografia 
antiga en el bilingüe, i tractaria les coses al nivell del monolingüe. 
Així només hem de canviar apertium-cat , no?




* Diacrítics.

En els diacrítics la cosa es complica una mica més, però no gaire.

Pel que fa a generar text en català:

Jo procuraria mantenir la capacitat de generar text segons la norma 
tradicional, a part de la nova. Internament ho deixaria tot com està, 
i intentaria fer el pas a les noves normes de diacrítics en la 
postedició (en apertium:-cat.post-cat.dix). Només caldria posar-hi la 
llista de paraules que canvien. Així hi hauria la possibilitat de 
generar amb un sistema i amb l'altre encara que fos tocant el codi.

Una opció com les geogràfiques?


Pel que fa a l'anàlisi de català:

La majoria de casos de diacrítics s'haurien de tractar igual que hem 
dit que tractaríem els canvis de e epentèticai de erra, però agafant 
la forma tradicional amb accent com a prioritària. Això passaria amb 
els composts (adéu, subsòl, etc.).


Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi 
del català admetria la nova versió sense diacrítics com una opció més. 
Són 140 entrades.
Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb 
prou dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç 
es podria resoldre amb bons percentatges d'encert (igual que hem fet 
en castellà per a desambiguar algunes paraules "difícils": empleo, 
pico, alero, cubo...).


I després queden paraules que són tan rares que no cal ni 
considerar-les (cóm, vénda, etc.).

Collins, he hagut de mirar "vénda". Estos eivissencs...

Que en diu la resta dels apertiumers catalaners?

Salut!

Mikel




Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i 
digueu-me si ho faríeu així o d'una altra manera.


Salutacions,
Jaume Ortolà



--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot


___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


--
Mikel L. Forcada  http://www.dlsi.ua.es/~mlf/
Departament de Llenguatges i Sistemes Informàtics
Universitat d'Alacant
E-03690 Sant Vicent del Raspeig
Spain
Office: +34 96 590 9776

--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


[Apertium-catala] canvis ortogràfics en català

2018-07-26 Thread Jaume Ortolà i Font
Bon dia,

Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a
Apertium, us faig cinc cèntims del que he pensat que seria més convenient
fer.

* Canvis de e epentètica i erra

Suposant que donem per bons els canvis, aquí no hi ha complicació. Es
tractaria de fer entrades com aquesta:

bacterioestàti
bacteriostàtibacterioestàti

En els bilingües faríem servir només la forma nova. Així tindríem l'anàlisi
en les dues formes i la síntesi en la forma nova.

* Diacrítics.

En els diacrítics la cosa es complica una mica més, però no gaire.

Pel que fa a generar text en català:

Jo procuraria mantenir la capacitat de generar text segons la norma
tradicional, a part de la nova. Internament ho deixaria tot com està, i
intentaria fer el pas a les noves normes de diacrítics en la postedició (en
apertium-cat.post-cat.dix). Només caldria posar-hi la llista de paraules
que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb
l'altre encara que fos tocant el codi.

Pel que fa a l'anàlisi de català:

La majoria de casos de diacrítics s'haurien de tractar igual que hem dit
que tractaríem els canvis de e epentètica i de erra, però agafant la forma
tradicional amb accent com a prioritària. Això passaria amb els composts
(adéu, subsòl, etc.).

Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou
dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria
resoldre amb bons percentatges d'encert (igual que hem fet en castellà per
a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...).

I després queden paraules que són tan rares que no cal ni considerar-les
(cóm, vénda, etc.).

Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me si
ho faríeu així o d'una altra manera.

Salutacions,
Jaume Ortolà
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala