Re: [Apertium-catala] canvis ortogràfics en català

2018-08-18 Thread Jaume Ortolà i Font
Missatge de Mikel L. Forcada  del dia ds., 18 d’ag. 2018 a
les 18:00:

> Això està molt bé, Xavi, per a generar. Així no hi ha problemes amb
> proliferació de variants. L'anàlisi, com la faríem finalment?
>
>
Com vaig dir al principi.

La majoria de paraules remetran a la paraula que duia diacrític en el
mateix monolingüe :
adeu -> adéu
subsol -> subsòl
rebesnet -> rebesnét
...

Però per a les paraules 5 o 6 paraules "difícils" (dona, venen, os, net,
soc...) caldrà mirar-ho cas per cas i veure si es pot desambiguar amb
Constraint Grammar.

Jo he provat un poc amb "dona". No es poden fer miracles. Caldria
analitzar-la com a verb quan està prou clar pel context: (dona'ns, li dona,
us la dona, dona lloc/ajuda/sang, que dona a, dona a entendre, etc.), i en
la resta de casos serà nom. Perquè tampoc no volem degradar massa els
resultats dels qui fan servir el diacrític tradicional (dóna).

Jaume

Mikel
>
> El 17/08/18 a les 13:30, Xavi Ivars ha escrit:
>
> He estat treballant en un nou mòdul per tal d'integrar els nous
> diacrítics. He creat tres modes mes (cat_novaortografia,
> cat_val_uni_novaortografia i cat_val_gva_novaortografia), però no es
> compilen nous diccionaris monolingües ni bilingües, només un petit
> "postgen" nou.
>
> Però calia un nou mòdul que s'aplicarà entre la generació i la
> post-generació (l'he anomenat "inter-generació" :P) La idea és que això
> permetrà fer "post-generació" en N fases, semblant al que es fa amb els
> interchunks i postchunks amb el transfer.
>
> En aquest cas, en una primera fase de post-generació (que no s'executarà
> si utilitzem els modes clàssics, amb l'ortografia clàssica), es faran els
> canvis ortogràfics. Després es farà la fase de post-generació actual, que
> té en compte coses com apostrofació, em -> me,...
>
>
> Missatge de Hèctor Alòs i Font  del dia dt., 31 de
> jul. 2018 a les 12:01:
>
>> I com està el tema de fer portables les regles de desambiguació amb CG en
>> els entorns en què, si no m'equivoco, no funcionen? Tot plegat, aquests
>> canvis encara donaran més pes a la desambiguació amb CG i faran que baixi
>> la qualitat de les traduccions en els entorns/aplicacions on CG no es pugui
>> utilitzar.
>>
>> El dia 31 de juliol de 2018 a les 11:52, Marc Riera Irigoyen <
>> marc.riera.irigo...@gmail.com> ha escrit:
>>
>>> Bon dia,
>>>
>>> Com ha dit en Xavi, si mantenim les formes actuals com a principals no
>>> només evitem haver de propagar canvis a tots els diccionaris bilingües (que
>>> en el fons no és tanta feina, però hi hauríem de dedicar una estona), sinó
>>> haver de crear "pseudolemes" com "mango_fruta" al diccionari. A més, els
>>> diacrítics que hem tingut fins ara ens beneficien a nivell de
>>> desambiguació, i segurament tinguem millors resultats així que amb les
>>> formes noves.
>>>
>>> Això pareix molt d'embolic. Si tu dius que és viable...
 Com a usuari voldria que hi hagués l'opció diacrítics nous/tradicionals
 (o l'opció d'accentuació cafè/café). Si es pot donar l'opció a l'usuari,
 perfecte. Si no, que com a mínim es puga fer d'alguna manera, encara que
 siga comentant part del codi i fix per a cada instal·lació d'Apertium.
>>>
>>>
>>> Això dels modes sembla un embolic a primera vista, però és simplement el
>>> funcionament intern d'Apertium, la manera que té de representar diferents
>>> parells (o en aquest cas, variants dins d'un mateix parell). Que per a
>>> l'usuari sigui més o menys difícil de fer servir dependrà de com es
>>> reprodueixi a la interfície. Personalment, seria partidari de mantenir al
>>> desplegable de la web les variants geogràfiques i afegir una casella
>>> independent a la part inferior (com es fa actualment a LanguageTool) per
>>> decidir el model de generació. No sóc jo qui s'encarrega de la interfície
>>> web, però fins on sé, es podria fer.
>>>
>>> *Marc Riera*
>>>
>>>
>>> Missatge de Xavi Ivars  del dia dv., 27 de jul.
>>> 2018 a les 21:17:
>>>


 Missatge de Jaume Ortolà i Font  del dia dj.,
 26 de jul. 2018 a les 23:03:

> Abans m'he descuidat un punt dels canvis ortogràfics: la dièresi
> (romboïdal > romboidal). Ho faria igual que amb la e epentètica.
>
> La meua proposta ve de la valoració personal que faig dels canvis, i
> per tant és subjectiva i discutible.
>
> Els canvis de la e, la erra i la dièresi em semblen positius (o
> indiferents). Per això, propose adoptar-los plenament (i posar-los en els
> bilingües) i no calfar-nos més el cap. No crec que hagen de mantenir-se 
> com
> a opció. No val la pena.
>
> Amb els diacrítics és diferent. Voldria que hi hagués la possibilitat
> de generar text amb la norma tradicional.
>
> Missatge de Xavi Ivars  del dia dj., 26 de jul.
> 2018 a les 19:54:
>
>> El que passarà és que, tot i que els canvis siguen només a la
>> post-edició, si que hi haurà una explosió de modes si volem "permetre" 
>> que
>> es puga fer qualsevol cosa.
>> * 

Re: [Apertium-catala] canvis ortogràfics en català

2018-08-18 Thread Mikel L. Forcada
Això està molt bé, Xavi, per a generar. Així no hi ha problemes amb 
proliferació de variants. L'anàlisi, com la faríem finalment?


Mikel


El 17/08/18 a les 13:30, Xavi Ivars ha escrit:
He estat treballant en un nou mòdul per tal d'integrar els nous 
diacrítics. He creat tres modes mes (cat_novaortografia, 
cat_val_uni_novaortografia i cat_val_gva_novaortografia), però no es 
compilen nous diccionaris monolingües ni bilingües, només un petit 
"postgen" nou.


Però calia un nou mòdul que s'aplicarà entre la generació i la 
post-generació (l'he anomenat "inter-generació" :P) La idea és que 
això permetrà fer "post-generació" en N fases, semblant al que es fa 
amb els interchunks i postchunks amb el transfer.


En aquest cas, en una primera fase de post-generació (que no 
s'executarà si utilitzem els modes clàssics, amb l'ortografia 
clàssica), es faran els canvis ortogràfics. Després es farà la fase de 
post-generació actual, que té en compte coses com apostrofació, em -> 
me,...



Missatge de Hèctor Alòs i Font > del dia dt., 31 de jul. 2018 a les 12:01:


I com està el tema de fer portables les regles de desambiguació
amb CG en els entorns en què, si no m'equivoco, no funcionen? Tot
plegat, aquests canvis encara donaran més pes a la desambiguació
amb CG i faran que baixi la qualitat de les traduccions en els
entorns/aplicacions on CG no es pugui utilitzar.

El dia 31 de juliol de 2018 a les 11:52, Marc Riera Irigoyen
mailto:marc.riera.irigo...@gmail.com>> ha escrit:

Bon dia,

Com ha dit en Xavi, si mantenim les formes actuals com a
principals no només evitem haver de propagar canvis a tots els
diccionaris bilingües (que en el fons no és tanta feina, però
hi hauríem de dedicar una estona), sinó haver de crear
"pseudolemes" com "mango_fruta" al diccionari. A més, els
diacrítics que hem tingut fins ara ens beneficien a nivell de
desambiguació, i segurament tinguem millors resultats així que
amb les formes noves.

Això pareix molt d'embolic. Si tu dius que és viable...
Com a usuari voldria que hi hagués l'opció diacrítics
nous/tradicionals (o l'opció d'accentuació cafè/café). Si
es pot donar l'opció a l'usuari, perfecte. Si no, que com
a mínim es puga fer d'alguna manera, encara que siga
comentant part del codi i fix per a cada instal·lació
d'Apertium.


Això dels modes sembla un embolic a primera vista, però és
simplement el funcionament intern d'Apertium, la manera que té
de representar diferents parells (o en aquest cas, variants
dins d'un mateix parell). Que per a l'usuari sigui més o menys
difícil de fer servir dependrà de com es reprodueixi a la
interfície. Personalment, seria partidari de mantenir al
desplegable de la web les variants geogràfiques i afegir una
casella independent a la part inferior (com es fa actualment a
LanguageTool) per decidir el model de generació. No sóc jo qui
s'encarrega de la interfície web, però fins on sé, es podria fer.

*Marc Riera*


Missatge de Xavi Ivars mailto:xavi.iv...@gmail.com>> del dia dv., 27 de jul. 2018 a
les 21:17:



Missatge de Jaume Ortolà i Font mailto:jaumeort...@gmail.com>> del dia dj., 26 de jul.
2018 a les 23:03:

Abans m'he descuidat un punt dels canvis ortogràfics:
la dièresi (romboïdal > romboidal). Ho faria igual que
amb la e epentètica.

La meua proposta ve de la valoració personal que faig
dels canvis, i per tant és subjectiva i discutible.

Els canvis de la e, la erra i la dièresi em semblen
positius (o indiferents). Per això, propose
adoptar-los plenament (i posar-los en els bilingües) i
no calfar-nos més el cap. No crec que hagen de
mantenir-se com a opció. No val la pena.

Amb els diacrítics és diferent. Voldria que hi hagués
la possibilitat de generar text amb la norma tradicional.

Missatge de Xavi Ivars mailto:xavi.iv...@gmail.com>> del dia dj., 26 de jul.
2018 a les 19:54:

El que passarà és que, tot i que els canvis siguen
només a la post-edició, si que hi haurà una
explosió de modes si volem "permetre" que es puga
fer qualsevol cosa.
* cat
* cat_val_uni
* cat_val_gva
* cat_nova
* cat_val_uni_nova
* cat_val_gva_nova


Això pareix molt d'embolic. Si tu dius que és viable...

Com a usuari voldria que hi hagués l'opció diacrítics