Hola,

entre les línies de Jaume:


Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a Apertium, us faig cinc cèntims del que he pensat que seria més convenient fer.

* Canvis de e epentètica i erra

Suposant que donem per bons els canvis, aquí no hi ha complicació. Es tractaria de fer entrades com aquesta:

<e lm="bacterioestàtic"> <i>bacterioestàti</i><par n="acadèmi/c__adj"/></e> <e r="LR" lm="bacteriostàtic"><p><l>bacteriostàti</l><r>bacterioestàti</r></p><par n=" acadèmi/c__adj "/></e>

En els bilingües faríem servir només la forma nova. Així tindríem l'anàlisi en les dues formes i la síntesi en la forma nova.

Jo, com a resistència simbòlica, mantindria les versions de l'ortografia antiga en el bilingüe, i tractaria les coses al nivell del monolingüe. Així només hem de canviar apertium-cat , no?


* Diacrítics.

En els diacrítics la cosa es complica una mica més, però no gaire.

Pel que fa a generar text en català:

Jo procuraria mantenir la capacitat de generar text segons la norma tradicional, a part de la nova. Internament ho deixaria tot com està, i intentaria fer el pas a les noves normes de diacrítics en la postedició (en apertium:-cat.post-cat.dix). Només caldria posar-hi la llista de paraules que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb l'altre encara que fos tocant el codi.
Una opció com les geogràfiques?

Pel que fa a l'anàlisi de català:

La majoria de casos de diacrítics s'haurien de tractar igual que hem dit que tractaríem els canvis de e epentèticai de erra, però agafant la forma tradicional amb accent com a prioritària. Això passaria amb els composts (adéu, subsòl, etc.).

Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi del català admetria la nova versió sense diacrítics com una opció més. Són 140 entrades.
Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria resoldre amb bons percentatges d'encert (igual que hem fet en castellà per a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...).

I després queden paraules que són tan rares que no cal ni considerar-les (cóm, vénda, etc.).
Collins, he hagut de mirar "vénda". Estos eivissencs...

Que en diu la resta dels apertiumers catalaners?

Salut!

Mikel



Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me si ho faríeu així o d'una altra manera.

Salutacions,
Jaume Ortolà



------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot


_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

--
Mikel L. Forcada  http://www.dlsi.ua.es/~mlf/
Departament de Llenguatges i Sistemes Informàtics
Universitat d'Alacant
E-03690 Sant Vicent del Raspeig
Spain
Office: +34 96 590 9776

------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to