Re: [Apertium-catala] Acrònims per a unitats
Anirem mirant els problemes que apunta Donís. Alguns crec que ja estan resolts. Una altra cosa que cal fer és vigilar què passa quan són lletres que formen part d'un nom propi, p. ex. Josep L. Garcia. Idealment s'haurien d'analitzar com a nom propi per a assegurar-nos que altres regles funcionen bé. Salutacions, Jaume Ortolà Missatge de Donís Seguí del dia dg., 9 de juny 2019 a les 21:01: > Bon dia, ja que tractem un tema paregut volia comentar un error que m'han > retret més d'una vegada. Quan apareix en castellà *D.*, que en molts > casos pots formar part d'una sigla o simplement la numeració d'un apartat, > interpreta que és el tractament de Don i tradueix per *Sr.* Això ho podem > solucionar d'alguna manera? > > I pel que fa a les lletres soltes, no sé si ha ho heu tractat ací alguna > vegada. Les lletres *Y,* conjunció, que tradueix per *I* quan va solta, i > això, en l'àmbit de les matematiques és un problema. El mateix passa amb la > conjunció *U*, en castellà. L'altre dia em vaig trobar unes figures d'uns > quadrilàters, en que els vèrtex s'anomenaven *R, S, T,* i *U.* El > programa va traduir* R, S, T, O.* > M'imagine que aquests casos no són fàcils de resoldre. En el mateix cas, > la lletra *e*, tant majúscula com minúscula, tradueix per *I*. Fins i tot > si va seguida de parèntesi per a enumerar un apartat. Així, trobem* a), > b), c), d) i)* > > > Donís > > Missatge de Hèctor Alòs i Font del dia dg., 9 de > juny 2019 a les 14:22: > >> Mai no he sabut gaire què fer amb les lletres soltes. Poden ser noms de >> lletra o noms de variable o inicials de persona o infinitat de coses. Per >> això no sé com seria millor tractar-les. "Endevinem" i posem "n.acr.m.sg", >> o bé posem "n.acr.mf.sp" o potser posem només "acr"? Posar "m" en el gènere >> farà que "I. Arrimadas" es considerarà de totes totes un home. No sé quina >> opció seria millor, però, de fer-ho, eliminaríem molts asteriscs, cosa bona. >> >> Cordialment, >> Hèctor >> >> Missatge de Jaume Ortolà i Font del dia dg., 9 >> de juny 2019 a les 13:05: >> >>> Un cas que s'haurà de valorar també és de les lletres soltes (m, s, >>> l...). Poden ser unitats (i per tant, masc sing/pl) o també simplement noms >>> de lletra (i per tant, fem sing). >>> >>> Salutacions, >>> Jaume Ortolà >>> >>> >>> >>> Missatge de Hèctor Alòs i Font del dia dg., 9 de >>> juny 2019 a les 11:57: >>> Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res a dir. Altrament, provaré de posar-m'hi el dimecres. Cordialment, Hèctor Missatge de Jaume Ortolà i Font del dia ds., 8 de juny 2019 a les 23:59: > Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, > em penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho > per a no se sap quan. > > Salutacions, > Jaume Ortolà > > > > Missatge de Hèctor Alòs i Font del dia ds., 8 > de juny 2019 a les 21:18: > >> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, >> etc.: >> >> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam >> "" >> "g" n f sg >> "" >> "mg" n m sp >> "" >> "kg" n m sp >> "" >> "mm" n m sp >> "" >> "cm" n acr m sp >> "" >> "m" n f sg >> "m" n acr m sp >> "" >> "km" n acr m sp >> "" >> "l" n m sp >> "l" n f sg >> "" >> "dl" n m sp >> "" >> "ml" n m sp >> "" >> "s" n f sg >> "<.>" >> "." sent >> >> Cada vegada que es fa un traductor a o del català, cal anar esbrinant >> com està codificada cada unitat de mesura. N'he creat les més habituals >> com >> a n.acr.m.sp: >> * n: perquè són noms i aquesta informació ajuda a la desambiguació >> * acr: perquè són acrònims >> * m: perquè les unitats que he posat són de gènere masculí (metres, >> grams, litres i derivats) >> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. >> Trobo que és millor incloure les dades morfològiques (part de >> l'oració, gènere i nombre) perquè ajuda tant a la desambiguació >> morfològica >> com a la generació del gènere i nombre convenient (per tant és millot que >> "acr" sense més). >> >> No he esborrat res del que hi havia per no fer mal a ningú, però no >> seria sobrer fer neteja alguna vegada. >> >> Cordialment, >> Hèctor >> ___ >> Apertium-catala mailing list >> Apertium-catala@lists.sourceforge.net >> https://lists.sourceforge.net/lists/listinfo/apertium-catala >> > ___ >> Apertium-catala mailing list >> Apertium-catala@lists.sourceforge.net >> https://lists.sourceforge.net/lists/listinfo/apertium-catala >> > ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net
Re: [Apertium-catala] Acrònims per a unitats
Bon dia, ja que tractem un tema paregut volia comentar un error que m'han retret més d'una vegada. Quan apareix en castellà *D.*, que en molts casos pots formar part d'una sigla o simplement la numeració d'un apartat, interpreta que és el tractament de Don i tradueix per *Sr.* Això ho podem solucionar d'alguna manera? I pel que fa a les lletres soltes, no sé si ha ho heu tractat ací alguna vegada. Les lletres *Y,* conjunció, que tradueix per *I* quan va solta, i això, en l'àmbit de les matematiques és un problema. El mateix passa amb la conjunció *U*, en castellà. L'altre dia em vaig trobar unes figures d'uns quadrilàters, en que els vèrtex s'anomenaven *R, S, T,* i *U.* El programa va traduir* R, S, T, O.* M'imagine que aquests casos no són fàcils de resoldre. En el mateix cas, la lletra *e*, tant majúscula com minúscula, tradueix per *I*. Fins i tot si va seguida de parèntesi per a enumerar un apartat. Així, trobem* a), b), c), d) i)* Donís Missatge de Hèctor Alòs i Font del dia dg., 9 de juny 2019 a les 14:22: > Mai no he sabut gaire què fer amb les lletres soltes. Poden ser noms de > lletra o noms de variable o inicials de persona o infinitat de coses. Per > això no sé com seria millor tractar-les. "Endevinem" i posem "n.acr.m.sg", > o bé posem "n.acr.mf.sp" o potser posem només "acr"? Posar "m" en el gènere > farà que "I. Arrimadas" es considerarà de totes totes un home. No sé quina > opció seria millor, però, de fer-ho, eliminaríem molts asteriscs, cosa bona. > > Cordialment, > Hèctor > > Missatge de Jaume Ortolà i Font del dia dg., 9 de > juny 2019 a les 13:05: > >> Un cas que s'haurà de valorar també és de les lletres soltes (m, s, >> l...). Poden ser unitats (i per tant, masc sing/pl) o també simplement noms >> de lletra (i per tant, fem sing). >> >> Salutacions, >> Jaume Ortolà >> >> >> >> Missatge de Hèctor Alòs i Font del dia dg., 9 de >> juny 2019 a les 11:57: >> >>> Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res >>> a dir. Altrament, provaré de posar-m'hi el dimecres. >>> Cordialment, >>> Hèctor >>> >>> Missatge de Jaume Ortolà i Font del dia ds., 8 >>> de juny 2019 a les 23:59: >>> Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, em penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho per a no se sap quan. Salutacions, Jaume Ortolà Missatge de Hèctor Alòs i Font del dia ds., 8 de juny 2019 a les 21:18: > Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, > etc.: > > echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam > "" > "g" n f sg > "" > "mg" n m sp > "" > "kg" n m sp > "" > "mm" n m sp > "" > "cm" n acr m sp > "" > "m" n f sg > "m" n acr m sp > "" > "km" n acr m sp > "" > "l" n m sp > "l" n f sg > "" > "dl" n m sp > "" > "ml" n m sp > "" > "s" n f sg > "<.>" > "." sent > > Cada vegada que es fa un traductor a o del català, cal anar esbrinant > com està codificada cada unitat de mesura. N'he creat les més habituals > com > a n.acr.m.sp: > * n: perquè són noms i aquesta informació ajuda a la desambiguació > * acr: perquè són acrònims > * m: perquè les unitats que he posat són de gènere masculí (metres, > grams, litres i derivats) > * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. > Trobo que és millor incloure les dades morfològiques (part de > l'oració, gènere i nombre) perquè ajuda tant a la desambiguació > morfològica > com a la generació del gènere i nombre convenient (per tant és millot que > "acr" sense més). > > No he esborrat res del que hi havia per no fer mal a ningú, però no > seria sobrer fer neteja alguna vegada. > > Cordialment, > Hèctor > ___ > Apertium-catala mailing list > Apertium-catala@lists.sourceforge.net > https://lists.sourceforge.net/lists/listinfo/apertium-catala > ___ > Apertium-catala mailing list > Apertium-catala@lists.sourceforge.net > https://lists.sourceforge.net/lists/listinfo/apertium-catala > ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
Re: [Apertium-catala] Acrònims per a unitats
Mai no he sabut gaire què fer amb les lletres soltes. Poden ser noms de lletra o noms de variable o inicials de persona o infinitat de coses. Per això no sé com seria millor tractar-les. "Endevinem" i posem "n.acr.m.sg", o bé posem "n.acr.mf.sp" o potser posem només "acr"? Posar "m" en el gènere farà que "I. Arrimadas" es considerarà de totes totes un home. No sé quina opció seria millor, però, de fer-ho, eliminaríem molts asteriscs, cosa bona. Cordialment, Hèctor Missatge de Jaume Ortolà i Font del dia dg., 9 de juny 2019 a les 13:05: > Un cas que s'haurà de valorar també és de les lletres soltes (m, s, l...). > Poden ser unitats (i per tant, masc sing/pl) o també simplement noms de > lletra (i per tant, fem sing). > > Salutacions, > Jaume Ortolà > > > > Missatge de Hèctor Alòs i Font del dia dg., 9 de > juny 2019 a les 11:57: > >> Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res a >> dir. Altrament, provaré de posar-m'hi el dimecres. >> Cordialment, >> Hèctor >> >> Missatge de Jaume Ortolà i Font del dia ds., 8 >> de juny 2019 a les 23:59: >> >>> Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, >>> em penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho >>> per a no se sap quan. >>> >>> Salutacions, >>> Jaume Ortolà >>> >>> >>> >>> Missatge de Hèctor Alòs i Font del dia ds., 8 de >>> juny 2019 a les 21:18: >>> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.: echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam "" "g" n f sg "" "mg" n m sp "" "kg" n m sp "" "mm" n m sp "" "cm" n acr m sp "" "m" n f sg "m" n acr m sp "" "km" n acr m sp "" "l" n m sp "l" n f sg "" "dl" n m sp "" "ml" n m sp "" "s" n f sg "<.>" "." sent Cada vegada que es fa un traductor a o del català, cal anar esbrinant com està codificada cada unitat de mesura. N'he creat les més habituals com a n.acr.m.sp: * n: perquè són noms i aquesta informació ajuda a la desambiguació * acr: perquè són acrònims * m: perquè les unitats que he posat són de gènere masculí (metres, grams, litres i derivats) * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. Trobo que és millor incloure les dades morfològiques (part de l'oració, gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la generació del gènere i nombre convenient (per tant és millot que "acr" sense més). No he esborrat res del que hi havia per no fer mal a ningú, però no seria sobrer fer neteja alguna vegada. Cordialment, Hèctor ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala >>> ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
Re: [Apertium-catala] Acrònims per a unitats
Un cas que s'haurà de valorar també és de les lletres soltes (m, s, l...). Poden ser unitats (i per tant, masc sing/pl) o també simplement noms de lletra (i per tant, fem sing). Salutacions, Jaume Ortolà Missatge de Hèctor Alòs i Font del dia dg., 9 de juny 2019 a les 11:57: > Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res a > dir. Altrament, provaré de posar-m'hi el dimecres. > Cordialment, > Hèctor > > Missatge de Jaume Ortolà i Font del dia ds., 8 de > juny 2019 a les 23:59: > >> Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, em >> penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho per >> a no se sap quan. >> >> Salutacions, >> Jaume Ortolà >> >> >> >> Missatge de Hèctor Alòs i Font del dia ds., 8 de >> juny 2019 a les 21:18: >> >>> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.: >>> >>> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam >>> "" >>> "g" n f sg >>> "" >>> "mg" n m sp >>> "" >>> "kg" n m sp >>> "" >>> "mm" n m sp >>> "" >>> "cm" n acr m sp >>> "" >>> "m" n f sg >>> "m" n acr m sp >>> "" >>> "km" n acr m sp >>> "" >>> "l" n m sp >>> "l" n f sg >>> "" >>> "dl" n m sp >>> "" >>> "ml" n m sp >>> "" >>> "s" n f sg >>> "<.>" >>> "." sent >>> >>> Cada vegada que es fa un traductor a o del català, cal anar esbrinant >>> com està codificada cada unitat de mesura. N'he creat les més habituals com >>> a n.acr.m.sp: >>> * n: perquè són noms i aquesta informació ajuda a la desambiguació >>> * acr: perquè són acrònims >>> * m: perquè les unitats que he posat són de gènere masculí (metres, >>> grams, litres i derivats) >>> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. >>> Trobo que és millor incloure les dades morfològiques (part de l'oració, >>> gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la >>> generació del gènere i nombre convenient (per tant és millot que "acr" >>> sense més). >>> >>> No he esborrat res del que hi havia per no fer mal a ningú, però no >>> seria sobrer fer neteja alguna vegada. >>> >>> Cordialment, >>> Hèctor >>> ___ >>> Apertium-catala mailing list >>> Apertium-catala@lists.sourceforge.net >>> https://lists.sourceforge.net/lists/listinfo/apertium-catala >>> >> ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
Re: [Apertium-catala] Acrònims per a unitats
Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res a dir. Altrament, provaré de posar-m'hi el dimecres. Cordialment, Hèctor Missatge de Jaume Ortolà i Font del dia ds., 8 de juny 2019 a les 23:59: > Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, em > penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho per > a no se sap quan. > > Salutacions, > Jaume Ortolà > > > > Missatge de Hèctor Alòs i Font del dia ds., 8 de > juny 2019 a les 21:18: > >> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.: >> >> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam >> "" >> "g" n f sg >> "" >> "mg" n m sp >> "" >> "kg" n m sp >> "" >> "mm" n m sp >> "" >> "cm" n acr m sp >> "" >> "m" n f sg >> "m" n acr m sp >> "" >> "km" n acr m sp >> "" >> "l" n m sp >> "l" n f sg >> "" >> "dl" n m sp >> "" >> "ml" n m sp >> "" >> "s" n f sg >> "<.>" >> "." sent >> >> Cada vegada que es fa un traductor a o del català, cal anar esbrinant com >> està codificada cada unitat de mesura. N'he creat les més habituals com a >> n.acr.m.sp: >> * n: perquè són noms i aquesta informació ajuda a la desambiguació >> * acr: perquè són acrònims >> * m: perquè les unitats que he posat són de gènere masculí (metres, >> grams, litres i derivats) >> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. >> Trobo que és millor incloure les dades morfològiques (part de l'oració, >> gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la >> generació del gènere i nombre convenient (per tant és millot que "acr" >> sense més). >> >> No he esborrat res del que hi havia per no fer mal a ningú, però no seria >> sobrer fer neteja alguna vegada. >> >> Cordialment, >> Hèctor >> ___ >> Apertium-catala mailing list >> Apertium-catala@lists.sourceforge.net >> https://lists.sourceforge.net/lists/listinfo/apertium-catala >> > ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
Re: [Apertium-catala] Acrònims per a unitats
Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, em penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho per a no se sap quan. Salutacions, Jaume Ortolà Missatge de Hèctor Alòs i Font del dia ds., 8 de juny 2019 a les 21:18: > Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.: > > echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam > "" > "g" n f sg > "" > "mg" n m sp > "" > "kg" n m sp > "" > "mm" n m sp > "" > "cm" n acr m sp > "" > "m" n f sg > "m" n acr m sp > "" > "km" n acr m sp > "" > "l" n m sp > "l" n f sg > "" > "dl" n m sp > "" > "ml" n m sp > "" > "s" n f sg > "<.>" > "." sent > > Cada vegada que es fa un traductor a o del català, cal anar esbrinant com > està codificada cada unitat de mesura. N'he creat les més habituals com a > n.acr.m.sp: > * n: perquè són noms i aquesta informació ajuda a la desambiguació > * acr: perquè són acrònims > * m: perquè les unitats que he posat són de gènere masculí (metres, grams, > litres i derivats) > * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. > Trobo que és millor incloure les dades morfològiques (part de l'oració, > gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la > generació del gènere i nombre convenient (per tant és millot que "acr" > sense més). > > No he esborrat res del que hi havia per no fer mal a ningú, però no seria > sobrer fer neteja alguna vegada. > > Cordialment, > Hèctor > ___ > Apertium-catala mailing list > Apertium-catala@lists.sourceforge.net > https://lists.sourceforge.net/lists/listinfo/apertium-catala > ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
[Apertium-catala] Acrònims per a unitats
Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.: echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam "" "g" n f sg "" "mg" n m sp "" "kg" n m sp "" "mm" n m sp "" "cm" n acr m sp "" "m" n f sg "m" n acr m sp "" "km" n acr m sp "" "l" n m sp "l" n f sg "" "dl" n m sp "" "ml" n m sp "" "s" n f sg "<.>" "." sent Cada vegada que es fa un traductor a o del català, cal anar esbrinant com està codificada cada unitat de mesura. N'he creat les més habituals com a n.acr.m.sp: * n: perquè són noms i aquesta informació ajuda a la desambiguació * acr: perquè són acrònims * m: perquè les unitats que he posat són de gènere masculí (metres, grams, litres i derivats) * sp: perquè no hi ha diferència de nombre en "m", "kg", etc. Trobo que és millor incloure les dades morfològiques (part de l'oració, gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la generació del gènere i nombre convenient (per tant és millot que "acr" sense més). No he esborrat res del que hi havia per no fer mal a ningú, però no seria sobrer fer neteja alguna vegada. Cordialment, Hèctor ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala