Re: [Apertium-catala] canvis ortogràfics en català

2018-07-26 Thread Xavi Ivars
A mi a priori em sembla una bona estratègia. No estic convençut de què és
millor, si mantenir la forma antiga als bilingües o la nova, però supose
que millor la antiga (sobretot per a no fer os_esquelet i os_animal com hem
hagut de fer amb mango_fruta en castellà).

El que passarà és que, tot i que els canvis siguen només a la post-edició,
si que hi haurà una explosió de modes si volem "permetre" que es puga fer
qualsevol cosa.
* cat
* cat_val_uni
* cat_val_gva
* cat_nova
* cat_val_uni_nova
* cat_val_gva_nova

Això, a priori, no és cap inconvenient (no estem parlant de multiplicar el
temps de compilació ni res semblant com si s'afegís una nova variant real
als diccionaris), però ho hem de tenir en compte.



Missatge de Mikel L. Forcada  del dia dj., 26 de jul. 2018
a les 19:39:

> Hola,
>
> entre les línies de Jaume:
>
>
> Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a
> Apertium, us faig cinc cèntims del que he pensat que seria més convenient
> fer.
>
> * Canvis de e epentètica i erra
>
> Suposant que donem per bons els canvis, aquí no hi ha complicació. Es
> tractaria de fer entrades com aquesta:
>
> bacterioestàti n="acadèmi/c__adj"/>
>  lm="bacteriostàtic">bacteriostàtibacterioestàti n=" acadèmi/c__adj "/>
>
> En els bilingües faríem servir només la forma nova. Així tindríem
> l'anàlisi en les dues formes i la síntesi en la forma nova.
>
> Jo, com a resistència simbòlica, mantindria les versions de l'ortografia
> antiga en el bilingüe, i tractaria les coses al nivell del monolingüe. Així
> només hem de canviar apertium-cat , no?
>
>
> * Diacrítics.
>
> En els diacrítics la cosa es complica una mica més, però no gaire.
>
> Pel que fa a generar text en català:
>
> Jo procuraria mantenir la capacitat de generar text segons la norma
> tradicional, a part de la nova. Internament ho deixaria tot com està, i
> intentaria fer el pas a les noves normes de diacrítics en la postedició (en
> apertium:-cat.post-cat.dix). Només caldria posar-hi la llista de paraules
> que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb
> l'altre encara que fos tocant el codi.
>
> Una opció com les geogràfiques?
>
>
> Pel que fa a l'anàlisi de català:
>
> La majoria de casos de diacrítics s'haurien de tractar igual que hem dit
> que tractaríem els canvis de e epentètica i de erra, però agafant la
> forma tradicional amb accent com a prioritària. Això passaria amb els
> composts (adéu, subsòl, etc.).
>
> Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi
> del català admetria la nova versió sense diacrítics com una opció més. Són
> 140 entrades.
>
> Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou
> dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria
> resoldre amb bons percentatges d'encert (igual que hem fet en castellà per
> a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...).
>
> I després queden paraules que són tan rares que no cal ni considerar-les
> (cóm, vénda, etc.).
>
> Collins, he hagut de mirar "vénda". Estos eivissencs...
>
> Que en diu la resta dels apertiumers catalaners?
>
> Salut!
>
> Mikel
>
>
>
> Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me
> si ho faríeu així o d'una altra manera.
>
> Salutacions,
> Jaume Ortolà
>
>
>
> --
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
>
>
>
> ___
> Apertium-catala mailing 
> listApertium-catala@lists.sourceforge.nethttps://lists.sourceforge.net/lists/listinfo/apertium-catala
>
>
> --
> Mikel L. Forcada  http://www.dlsi.ua.es/~mlf/
> Departament de Llenguatges i Sistemes Informàtics
> Universitat d'Alacant
> E-03690 Sant Vicent del Raspeig
> Spain
> Office: +34 96 590 9776
>
>
> --
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>


-- 
< Xavi Ivars >
< http://xavi.ivars.me >
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] canvis ortogràfics en català

2018-07-26 Thread Mikel L. Forcada

Hola,

entre les línies de Jaume:



Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a 
Apertium, us faig cinc cèntims del que he pensat que seria més 
convenient fer.


* Canvis de e epentètica i erra

Suposant que donem per bons els canvis, aquí no hi ha complicació. Es 
tractaria de fer entrades com aquesta:


 bacterioestàtin="acadèmi/c__adj"/>
lm="bacteriostàtic">bacteriostàtibacterioestàtin=" acadèmi/c__adj "/>


En els bilingües faríem servir només la forma nova. Així tindríem 
l'anàlisi en les dues formes i la síntesi en la forma nova.


Jo, com a resistència simbòlica, mantindria les versions de l'ortografia 
antiga en el bilingüe, i tractaria les coses al nivell del monolingüe. 
Així només hem de canviar apertium-cat , no?




* Diacrítics.

En els diacrítics la cosa es complica una mica més, però no gaire.

Pel que fa a generar text en català:

Jo procuraria mantenir la capacitat de generar text segons la norma 
tradicional, a part de la nova. Internament ho deixaria tot com està, 
i intentaria fer el pas a les noves normes de diacrítics en la 
postedició (en apertium:-cat.post-cat.dix). Només caldria posar-hi la 
llista de paraules que canvien. Així hi hauria la possibilitat de 
generar amb un sistema i amb l'altre encara que fos tocant el codi.

Una opció com les geogràfiques?


Pel que fa a l'anàlisi de català:

La majoria de casos de diacrítics s'haurien de tractar igual que hem 
dit que tractaríem els canvis de e epentèticai de erra, però agafant 
la forma tradicional amb accent com a prioritària. Això passaria amb 
els composts (adéu, subsòl, etc.).


Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi 
del català admetria la nova versió sense diacrítics com una opció més. 
Són 140 entrades.
Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb 
prou dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç 
es podria resoldre amb bons percentatges d'encert (igual que hem fet 
en castellà per a desambiguar algunes paraules "difícils": empleo, 
pico, alero, cubo...).


I després queden paraules que són tan rares que no cal ni 
considerar-les (cóm, vénda, etc.).

Collins, he hagut de mirar "vénda". Estos eivissencs...

Que en diu la resta dels apertiumers catalaners?

Salut!

Mikel




Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i 
digueu-me si ho faríeu així o d'una altra manera.


Salutacions,
Jaume Ortolà



--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot


___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


--
Mikel L. Forcada  http://www.dlsi.ua.es/~mlf/
Departament de Llenguatges i Sistemes Informàtics
Universitat d'Alacant
E-03690 Sant Vicent del Raspeig
Spain
Office: +34 96 590 9776

--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


[Apertium-catala] canvis ortogràfics en català

2018-07-26 Thread Jaume Ortolà i Font
Bon dia,

Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a
Apertium, us faig cinc cèntims del que he pensat que seria més convenient
fer.

* Canvis de e epentètica i erra

Suposant que donem per bons els canvis, aquí no hi ha complicació. Es
tractaria de fer entrades com aquesta:

bacterioestàti
bacteriostàtibacterioestàti

En els bilingües faríem servir només la forma nova. Així tindríem l'anàlisi
en les dues formes i la síntesi en la forma nova.

* Diacrítics.

En els diacrítics la cosa es complica una mica més, però no gaire.

Pel que fa a generar text en català:

Jo procuraria mantenir la capacitat de generar text segons la norma
tradicional, a part de la nova. Internament ho deixaria tot com està, i
intentaria fer el pas a les noves normes de diacrítics en la postedició (en
apertium-cat.post-cat.dix). Només caldria posar-hi la llista de paraules
que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb
l'altre encara que fos tocant el codi.

Pel que fa a l'anàlisi de català:

La majoria de casos de diacrítics s'haurien de tractar igual que hem dit
que tractaríem els canvis de e epentètica i de erra, però agafant la forma
tradicional amb accent com a prioritària. Això passaria amb els composts
(adéu, subsòl, etc.).

Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou
dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria
resoldre amb bons percentatges d'encert (igual que hem fet en castellà per
a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...).

I després queden paraules que són tan rares que no cal ni considerar-les
(cóm, vénda, etc.).

Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me si
ho faríeu així o d'una altra manera.

Salutacions,
Jaume Ortolà
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala