Re: [Apertium-catala] canvis ortogràfics en català
A mi a priori em sembla una bona estratègia. No estic convençut de què és millor, si mantenir la forma antiga als bilingües o la nova, però supose que millor la antiga (sobretot per a no fer os_esquelet i os_animal com hem hagut de fer amb mango_fruta en castellà). El que passarà és que, tot i que els canvis siguen només a la post-edició, si que hi haurà una explosió de modes si volem "permetre" que es puga fer qualsevol cosa. * cat * cat_val_uni * cat_val_gva * cat_nova * cat_val_uni_nova * cat_val_gva_nova Això, a priori, no és cap inconvenient (no estem parlant de multiplicar el temps de compilació ni res semblant com si s'afegís una nova variant real als diccionaris), però ho hem de tenir en compte. Missatge de Mikel L. Forcada del dia dj., 26 de jul. 2018 a les 19:39: > Hola, > > entre les línies de Jaume: > > > Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a > Apertium, us faig cinc cèntims del que he pensat que seria més convenient > fer. > > * Canvis de e epentètica i erra > > Suposant que donem per bons els canvis, aquí no hi ha complicació. Es > tractaria de fer entrades com aquesta: > > bacterioestàti n="acadèmi/c__adj"/> > lm="bacteriostàtic">bacteriostàtibacterioestàti n=" acadèmi/c__adj "/> > > En els bilingües faríem servir només la forma nova. Així tindríem > l'anàlisi en les dues formes i la síntesi en la forma nova. > > Jo, com a resistència simbòlica, mantindria les versions de l'ortografia > antiga en el bilingüe, i tractaria les coses al nivell del monolingüe. Així > només hem de canviar apertium-cat , no? > > > * Diacrítics. > > En els diacrítics la cosa es complica una mica més, però no gaire. > > Pel que fa a generar text en català: > > Jo procuraria mantenir la capacitat de generar text segons la norma > tradicional, a part de la nova. Internament ho deixaria tot com està, i > intentaria fer el pas a les noves normes de diacrítics en la postedició (en > apertium:-cat.post-cat.dix). Només caldria posar-hi la llista de paraules > que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb > l'altre encara que fos tocant el codi. > > Una opció com les geogràfiques? > > > Pel que fa a l'anàlisi de català: > > La majoria de casos de diacrítics s'haurien de tractar igual que hem dit > que tractaríem els canvis de e epentètica i de erra, però agafant la > forma tradicional amb accent com a prioritària. Això passaria amb els > composts (adéu, subsòl, etc.). > > Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi > del català admetria la nova versió sense diacrítics com una opció més. Són > 140 entrades. > > Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou > dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria > resoldre amb bons percentatges d'encert (igual que hem fet en castellà per > a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...). > > I després queden paraules que són tan rares que no cal ni considerar-les > (cóm, vénda, etc.). > > Collins, he hagut de mirar "vénda". Estos eivissencs... > > Que en diu la resta dels apertiumers catalaners? > > Salut! > > Mikel > > > > Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me > si ho faríeu així o d'una altra manera. > > Salutacions, > Jaume Ortolà > > > > -- > Check out the vibrant tech community on one of the world's most > engaging tech sites, Slashdot.org! http://sdm.link/slashdot > > > > ___ > Apertium-catala mailing > listApertium-catala@lists.sourceforge.nethttps://lists.sourceforge.net/lists/listinfo/apertium-catala > > > -- > Mikel L. Forcada http://www.dlsi.ua.es/~mlf/ > Departament de Llenguatges i Sistemes Informàtics > Universitat d'Alacant > E-03690 Sant Vicent del Raspeig > Spain > Office: +34 96 590 9776 > > > -- > Check out the vibrant tech community on one of the world's most > engaging tech sites, Slashdot.org! http://sdm.link/slashdot > ___ > Apertium-catala mailing list > Apertium-catala@lists.sourceforge.net > https://lists.sourceforge.net/lists/listinfo/apertium-catala > -- < Xavi Ivars > < http://xavi.ivars.me > -- Check out the vibrant tech community on one of the world's most engaging tech sites, Slashdot.org! http://sdm.link/slashdot___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
Re: [Apertium-catala] canvis ortogràfics en català
Hola, entre les línies de Jaume: Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a Apertium, us faig cinc cèntims del que he pensat que seria més convenient fer. * Canvis de e epentètica i erra Suposant que donem per bons els canvis, aquí no hi ha complicació. Es tractaria de fer entrades com aquesta: bacterioestàtin="acadèmi/c__adj"/> lm="bacteriostàtic">bacteriostàtibacterioestàtin=" acadèmi/c__adj "/> En els bilingües faríem servir només la forma nova. Així tindríem l'anàlisi en les dues formes i la síntesi en la forma nova. Jo, com a resistència simbòlica, mantindria les versions de l'ortografia antiga en el bilingüe, i tractaria les coses al nivell del monolingüe. Així només hem de canviar apertium-cat , no? * Diacrítics. En els diacrítics la cosa es complica una mica més, però no gaire. Pel que fa a generar text en català: Jo procuraria mantenir la capacitat de generar text segons la norma tradicional, a part de la nova. Internament ho deixaria tot com està, i intentaria fer el pas a les noves normes de diacrítics en la postedició (en apertium:-cat.post-cat.dix). Només caldria posar-hi la llista de paraules que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb l'altre encara que fos tocant el codi. Una opció com les geogràfiques? Pel que fa a l'anàlisi de català: La majoria de casos de diacrítics s'haurien de tractar igual que hem dit que tractaríem els canvis de e epentèticai de erra, però agafant la forma tradicional amb accent com a prioritària. Això passaria amb els composts (adéu, subsòl, etc.). Jo usaria en general usaria com a forma principal l'antiga. En l'anàlisi del català admetria la nova versió sense diacrítics com una opció més. Són 140 entrades. Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria resoldre amb bons percentatges d'encert (igual que hem fet en castellà per a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...). I després queden paraules que són tan rares que no cal ni considerar-les (cóm, vénda, etc.). Collins, he hagut de mirar "vénda". Estos eivissencs... Que en diu la resta dels apertiumers catalaners? Salut! Mikel Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me si ho faríeu així o d'una altra manera. Salutacions, Jaume Ortolà -- Check out the vibrant tech community on one of the world's most engaging tech sites, Slashdot.org! http://sdm.link/slashdot ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala -- Mikel L. Forcada http://www.dlsi.ua.es/~mlf/ Departament de Llenguatges i Sistemes Informàtics Universitat d'Alacant E-03690 Sant Vicent del Raspeig Spain Office: +34 96 590 9776 -- Check out the vibrant tech community on one of the world's most engaging tech sites, Slashdot.org! http://sdm.link/slashdot___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
[Apertium-catala] canvis ortogràfics en català
Bon dia, Com que un dia o altre ens demanaran aplicar els canvis ortogràfics a Apertium, us faig cinc cèntims del que he pensat que seria més convenient fer. * Canvis de e epentètica i erra Suposant que donem per bons els canvis, aquí no hi ha complicació. Es tractaria de fer entrades com aquesta: bacterioestàti bacteriostàtibacterioestàti En els bilingües faríem servir només la forma nova. Així tindríem l'anàlisi en les dues formes i la síntesi en la forma nova. * Diacrítics. En els diacrítics la cosa es complica una mica més, però no gaire. Pel que fa a generar text en català: Jo procuraria mantenir la capacitat de generar text segons la norma tradicional, a part de la nova. Internament ho deixaria tot com està, i intentaria fer el pas a les noves normes de diacrítics en la postedició (en apertium-cat.post-cat.dix). Només caldria posar-hi la llista de paraules que canvien. Així hi hauria la possibilitat de generar amb un sistema i amb l'altre encara que fos tocant el codi. Pel que fa a l'anàlisi de català: La majoria de casos de diacrítics s'haurien de tractar igual que hem dit que tractaríem els canvis de e epentètica i de erra, però agafant la forma tradicional amb accent com a prioritària. Això passaria amb els composts (adéu, subsòl, etc.). Hi hauria 5 o 6 paraules que requeririen desambiguació, alguna amb prou dificultat (venen, os, net, soc, dona...). Amb una mica d'esforç es podria resoldre amb bons percentatges d'encert (igual que hem fet en castellà per a desambiguar algunes paraules "difícils": empleo, pico, alero, cubo...). I després queden paraules que són tan rares que no cal ni considerar-les (cóm, vénda, etc.). Això és tot. No crec que sigui res molt traumàtic. Penseu-hi i digueu-me si ho faríeu així o d'una altra manera. Salutacions, Jaume Ortolà -- Check out the vibrant tech community on one of the world's most engaging tech sites, Slashdot.org! http://sdm.link/slashdot___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala