Re: [Apertium-catala] Acrònims per a unitats

2019-06-10 Thread Jaume Ortolà i Font
Anirem mirant els problemes que apunta Donís. Alguns crec que ja estan
resolts.

Una altra cosa que cal fer és vigilar què passa quan són lletres que formen
part d'un nom propi, p. ex. Josep L. Garcia. Idealment s'haurien
d'analitzar com a nom propi per a assegurar-nos que altres regles funcionen
bé.

Salutacions,
Jaume Ortolà


Missatge de Donís Seguí  del dia dg., 9 de juny 2019
a les 21:01:

> Bon dia, ja que tractem un tema paregut volia comentar un error que m'han
> retret més d'una vegada. Quan apareix en castellà *D.*, que en molts
> casos pots formar part d'una sigla o simplement la numeració d'un apartat,
> interpreta que és el tractament de Don i tradueix per *Sr.* Això ho podem
> solucionar d'alguna manera?
>
> I pel que fa a les lletres soltes, no sé si ha ho heu tractat ací alguna
> vegada. Les lletres *Y,* conjunció, que tradueix per *I* quan va solta, i
> això, en l'àmbit de les matematiques és un problema. El mateix passa amb la
> conjunció *U*, en castellà. L'altre dia em vaig trobar unes figures d'uns
> quadrilàters, en que els vèrtex s'anomenaven *R, S, T,* i *U.* El
> programa va traduir* R, S, T, O.*
> M'imagine que aquests casos no són fàcils de resoldre. En el mateix cas,
> la lletra *e*, tant majúscula com minúscula, tradueix per *I*. Fins i tot
> si va seguida de parèntesi per a enumerar un apartat. Així, trobem* a),
> b), c), d) i)*
>
>
> Donís
>
> Missatge de Hèctor Alòs i Font  del dia dg., 9 de
> juny 2019 a les 14:22:
>
>> Mai no he sabut gaire què fer amb les lletres soltes. Poden ser noms de
>> lletra o noms de variable o inicials de persona o infinitat de coses. Per
>> això no sé com seria millor tractar-les. "Endevinem" i posem "n.acr.m.sg",
>> o bé posem "n.acr.mf.sp" o potser posem només "acr"? Posar "m" en el gènere
>> farà que "I. Arrimadas" es considerarà de totes totes un home. No sé quina
>> opció seria millor, però, de fer-ho, eliminaríem molts asteriscs, cosa bona.
>>
>> Cordialment,
>> Hèctor
>>
>> Missatge de Jaume Ortolà i Font  del dia dg., 9
>> de juny 2019 a les 13:05:
>>
>>> Un cas que s'haurà de valorar també és de les lletres soltes (m, s,
>>> l...). Poden ser unitats (i per tant, masc sing/pl) o també simplement noms
>>> de lletra (i per tant, fem sing).
>>>
>>> Salutacions,
>>> Jaume Ortolà
>>>
>>>
>>>
>>> Missatge de Hèctor Alòs i Font  del dia dg., 9 de
>>> juny 2019 a les 11:57:
>>>
 Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res
 a dir. Altrament, provaré de posar-m'hi el dimecres.
 Cordialment,
 Hèctor

 Missatge de Jaume Ortolà i Font  del dia ds., 8
 de juny 2019 a les 23:59:

> Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet,
> em penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho
> per a no se sap quan.
>
> Salutacions,
> Jaume Ortolà
>
>
>
> Missatge de Hèctor Alòs i Font  del dia ds., 8
> de juny 2019 a les 21:18:
>
>> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml,
>> etc.:
>>
>> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
>> ""
>> "g" n f sg
>> ""
>> "mg" n m sp
>> ""
>> "kg" n m sp
>> ""
>> "mm" n m sp
>> ""
>> "cm" n acr m sp
>> ""
>> "m" n f sg
>> "m" n acr m sp
>> ""
>> "km" n acr m sp
>> ""
>> "l" n m sp
>> "l" n f sg
>> ""
>> "dl" n m sp
>> ""
>> "ml" n m sp
>> ""
>> "s" n f sg
>> "<.>"
>> "." sent
>>
>> Cada vegada que es fa un traductor a o del català, cal anar esbrinant
>> com està codificada cada unitat de mesura. N'he creat les més habituals 
>> com
>> a n.acr.m.sp:
>> * n: perquè són noms i aquesta informació ajuda a la desambiguació
>> * acr: perquè són acrònims
>> * m: perquè les unitats que he posat són de gènere masculí (metres,
>> grams, litres i derivats)
>> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
>> Trobo que és millor incloure les dades morfològiques (part de
>> l'oració, gènere i nombre) perquè ajuda tant a la desambiguació 
>> morfològica
>> com a la generació del gènere i nombre convenient (per tant és millot que
>> "acr" sense més).
>>
>> No he esborrat res del que hi havia per no fer mal a ningú, però no
>> seria sobrer fer neteja alguna vegada.
>>
>> Cordialment,
>> Hèctor
>> ___
>> Apertium-catala mailing list
>> Apertium-catala@lists.sourceforge.net
>> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>>
> ___
>> Apertium-catala mailing list
>> Apertium-catala@lists.sourceforge.net
>> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>>
>
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net

Re: [Apertium-catala] Acrònims per a unitats

2019-06-09 Thread Donís Seguí
Bon dia, ja que tractem un tema paregut volia comentar un error que m'han
retret més d'una vegada. Quan apareix en castellà *D.*, que en molts casos
pots formar part d'una sigla o simplement la numeració d'un apartat,
interpreta que és el tractament de Don i tradueix per *Sr.* Això ho podem
solucionar d'alguna manera?

I pel que fa a les lletres soltes, no sé si ha ho heu tractat ací alguna
vegada. Les lletres *Y,* conjunció, que tradueix per *I* quan va solta, i
això, en l'àmbit de les matematiques és un problema. El mateix passa amb la
conjunció *U*, en castellà. L'altre dia em vaig trobar unes figures d'uns
quadrilàters, en que els vèrtex s'anomenaven *R, S, T,* i *U.* El programa
va traduir* R, S, T, O.*
M'imagine que aquests casos no són fàcils de resoldre. En el mateix cas, la
lletra *e*, tant majúscula com minúscula, tradueix per *I*. Fins i tot si
va seguida de parèntesi per a enumerar un apartat. Així, trobem* a), b),
c), d) i)*


Donís

Missatge de Hèctor Alòs i Font  del dia dg., 9 de
juny 2019 a les 14:22:

> Mai no he sabut gaire què fer amb les lletres soltes. Poden ser noms de
> lletra o noms de variable o inicials de persona o infinitat de coses. Per
> això no sé com seria millor tractar-les. "Endevinem" i posem "n.acr.m.sg",
> o bé posem "n.acr.mf.sp" o potser posem només "acr"? Posar "m" en el gènere
> farà que "I. Arrimadas" es considerarà de totes totes un home. No sé quina
> opció seria millor, però, de fer-ho, eliminaríem molts asteriscs, cosa bona.
>
> Cordialment,
> Hèctor
>
> Missatge de Jaume Ortolà i Font  del dia dg., 9 de
> juny 2019 a les 13:05:
>
>> Un cas que s'haurà de valorar també és de les lletres soltes (m, s,
>> l...). Poden ser unitats (i per tant, masc sing/pl) o també simplement noms
>> de lletra (i per tant, fem sing).
>>
>> Salutacions,
>> Jaume Ortolà
>>
>>
>>
>> Missatge de Hèctor Alòs i Font  del dia dg., 9 de
>> juny 2019 a les 11:57:
>>
>>> Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res
>>> a dir. Altrament, provaré de posar-m'hi el dimecres.
>>> Cordialment,
>>> Hèctor
>>>
>>> Missatge de Jaume Ortolà i Font  del dia ds., 8
>>> de juny 2019 a les 23:59:
>>>
 Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet,
 em penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho
 per a no se sap quan.

 Salutacions,
 Jaume Ortolà



 Missatge de Hèctor Alòs i Font  del dia ds., 8
 de juny 2019 a les 21:18:

> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml,
> etc.:
>
> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
> ""
> "g" n f sg
> ""
> "mg" n m sp
> ""
> "kg" n m sp
> ""
> "mm" n m sp
> ""
> "cm" n acr m sp
> ""
> "m" n f sg
> "m" n acr m sp
> ""
> "km" n acr m sp
> ""
> "l" n m sp
> "l" n f sg
> ""
> "dl" n m sp
> ""
> "ml" n m sp
> ""
> "s" n f sg
> "<.>"
> "." sent
>
> Cada vegada que es fa un traductor a o del català, cal anar esbrinant
> com està codificada cada unitat de mesura. N'he creat les més habituals 
> com
> a n.acr.m.sp:
> * n: perquè són noms i aquesta informació ajuda a la desambiguació
> * acr: perquè són acrònims
> * m: perquè les unitats que he posat són de gènere masculí (metres,
> grams, litres i derivats)
> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
> Trobo que és millor incloure les dades morfològiques (part de
> l'oració, gènere i nombre) perquè ajuda tant a la desambiguació 
> morfològica
> com a la generació del gènere i nombre convenient (per tant és millot que
> "acr" sense més).
>
> No he esborrat res del que hi havia per no fer mal a ningú, però no
> seria sobrer fer neteja alguna vegada.
>
> Cordialment,
> Hèctor
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
 ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] Acrònims per a unitats

2019-06-09 Thread Hèctor Alòs i Font
Mai no he sabut gaire què fer amb les lletres soltes. Poden ser noms de
lletra o noms de variable o inicials de persona o infinitat de coses. Per
això no sé com seria millor tractar-les. "Endevinem" i posem "n.acr.m.sg",
o bé posem "n.acr.mf.sp" o potser posem només "acr"? Posar "m" en el gènere
farà que "I. Arrimadas" es considerarà de totes totes un home. No sé quina
opció seria millor, però, de fer-ho, eliminaríem molts asteriscs, cosa bona.

Cordialment,
Hèctor

Missatge de Jaume Ortolà i Font  del dia dg., 9 de
juny 2019 a les 13:05:

> Un cas que s'haurà de valorar també és de les lletres soltes (m, s, l...).
> Poden ser unitats (i per tant, masc sing/pl) o també simplement noms de
> lletra (i per tant, fem sing).
>
> Salutacions,
> Jaume Ortolà
>
>
>
> Missatge de Hèctor Alòs i Font  del dia dg., 9 de
> juny 2019 a les 11:57:
>
>> Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res a
>> dir. Altrament, provaré de posar-m'hi el dimecres.
>> Cordialment,
>> Hèctor
>>
>> Missatge de Jaume Ortolà i Font  del dia ds., 8
>> de juny 2019 a les 23:59:
>>
>>> Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet,
>>> em penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho
>>> per a no se sap quan.
>>>
>>> Salutacions,
>>> Jaume Ortolà
>>>
>>>
>>>
>>> Missatge de Hèctor Alòs i Font  del dia ds., 8 de
>>> juny 2019 a les 21:18:
>>>
 Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml,
 etc.:

 echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
 ""
 "g" n f sg
 ""
 "mg" n m sp
 ""
 "kg" n m sp
 ""
 "mm" n m sp
 ""
 "cm" n acr m sp
 ""
 "m" n f sg
 "m" n acr m sp
 ""
 "km" n acr m sp
 ""
 "l" n m sp
 "l" n f sg
 ""
 "dl" n m sp
 ""
 "ml" n m sp
 ""
 "s" n f sg
 "<.>"
 "." sent

 Cada vegada que es fa un traductor a o del català, cal anar esbrinant
 com està codificada cada unitat de mesura. N'he creat les més habituals com
 a n.acr.m.sp:
 * n: perquè són noms i aquesta informació ajuda a la desambiguació
 * acr: perquè són acrònims
 * m: perquè les unitats que he posat són de gènere masculí (metres,
 grams, litres i derivats)
 * sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
 Trobo que és millor incloure les dades morfològiques (part de l'oració,
 gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la
 generació del gènere i nombre convenient (per tant és millot que "acr"
 sense més).

 No he esborrat res del que hi havia per no fer mal a ningú, però no
 seria sobrer fer neteja alguna vegada.

 Cordialment,
 Hèctor
 ___
 Apertium-catala mailing list
 Apertium-catala@lists.sourceforge.net
 https://lists.sourceforge.net/lists/listinfo/apertium-catala

>>>
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] Acrònims per a unitats

2019-06-09 Thread Jaume Ortolà i Font
Un cas que s'haurà de valorar també és de les lletres soltes (m, s, l...).
Poden ser unitats (i per tant, masc sing/pl) o també simplement noms de
lletra (i per tant, fem sing).

Salutacions,
Jaume Ortolà



Missatge de Hèctor Alòs i Font  del dia dg., 9 de
juny 2019 a les 11:57:

> Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res a
> dir. Altrament, provaré de posar-m'hi el dimecres.
> Cordialment,
> Hèctor
>
> Missatge de Jaume Ortolà i Font  del dia ds., 8 de
> juny 2019 a les 23:59:
>
>> Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, em
>> penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho per
>> a no se sap quan.
>>
>> Salutacions,
>> Jaume Ortolà
>>
>>
>>
>> Missatge de Hèctor Alòs i Font  del dia ds., 8 de
>> juny 2019 a les 21:18:
>>
>>> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.:
>>>
>>> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
>>> ""
>>> "g" n f sg
>>> ""
>>> "mg" n m sp
>>> ""
>>> "kg" n m sp
>>> ""
>>> "mm" n m sp
>>> ""
>>> "cm" n acr m sp
>>> ""
>>> "m" n f sg
>>> "m" n acr m sp
>>> ""
>>> "km" n acr m sp
>>> ""
>>> "l" n m sp
>>> "l" n f sg
>>> ""
>>> "dl" n m sp
>>> ""
>>> "ml" n m sp
>>> ""
>>> "s" n f sg
>>> "<.>"
>>> "." sent
>>>
>>> Cada vegada que es fa un traductor a o del català, cal anar esbrinant
>>> com està codificada cada unitat de mesura. N'he creat les més habituals com
>>> a n.acr.m.sp:
>>> * n: perquè són noms i aquesta informació ajuda a la desambiguació
>>> * acr: perquè són acrònims
>>> * m: perquè les unitats que he posat són de gènere masculí (metres,
>>> grams, litres i derivats)
>>> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
>>> Trobo que és millor incloure les dades morfològiques (part de l'oració,
>>> gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la
>>> generació del gènere i nombre convenient (per tant és millot que "acr"
>>> sense més).
>>>
>>> No he esborrat res del que hi havia per no fer mal a ningú, però no
>>> seria sobrer fer neteja alguna vegada.
>>>
>>> Cordialment,
>>> Hèctor
>>> ___
>>> Apertium-catala mailing list
>>> Apertium-catala@lists.sourceforge.net
>>> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>>>
>>
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] Acrònims per a unitats

2019-06-09 Thread Hèctor Alòs i Font
Molt bé. Deixaré passar un parell de dies feiners per si algú hi té res a
dir. Altrament, provaré de posar-m'hi el dimecres.
Cordialment,
Hèctor

Missatge de Jaume Ortolà i Font  del dia ds., 8 de
juny 2019 a les 23:59:

> Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, em
> penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho per
> a no se sap quan.
>
> Salutacions,
> Jaume Ortolà
>
>
>
> Missatge de Hèctor Alòs i Font  del dia ds., 8 de
> juny 2019 a les 21:18:
>
>> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.:
>>
>> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
>> ""
>> "g" n f sg
>> ""
>> "mg" n m sp
>> ""
>> "kg" n m sp
>> ""
>> "mm" n m sp
>> ""
>> "cm" n acr m sp
>> ""
>> "m" n f sg
>> "m" n acr m sp
>> ""
>> "km" n acr m sp
>> ""
>> "l" n m sp
>> "l" n f sg
>> ""
>> "dl" n m sp
>> ""
>> "ml" n m sp
>> ""
>> "s" n f sg
>> "<.>"
>> "." sent
>>
>> Cada vegada que es fa un traductor a o del català, cal anar esbrinant com
>> està codificada cada unitat de mesura. N'he creat les més habituals com a
>> n.acr.m.sp:
>> * n: perquè són noms i aquesta informació ajuda a la desambiguació
>> * acr: perquè són acrònims
>> * m: perquè les unitats que he posat són de gènere masculí (metres,
>> grams, litres i derivats)
>> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
>> Trobo que és millor incloure les dades morfològiques (part de l'oració,
>> gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la
>> generació del gènere i nombre convenient (per tant és millot que "acr"
>> sense més).
>>
>> No he esborrat res del que hi havia per no fer mal a ningú, però no seria
>> sobrer fer neteja alguna vegada.
>>
>> Cordialment,
>> Hèctor
>> ___
>> Apertium-catala mailing list
>> Apertium-catala@lists.sourceforge.net
>> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>>
>
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] Acrònims per a unitats

2019-06-08 Thread Jaume Ortolà i Font
Em sembla molt bé, Hèctor. Si vols fer "neteja", per mi avant. De fet, em
penso que val més fer-la ara (que saps on s'ha de fer) que no deixar-ho per
a no se sap quan.

Salutacions,
Jaume Ortolà



Missatge de Hèctor Alòs i Font  del dia ds., 8 de
juny 2019 a les 21:18:

> Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.:
>
> echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
> ""
> "g" n f sg
> ""
> "mg" n m sp
> ""
> "kg" n m sp
> ""
> "mm" n m sp
> ""
> "cm" n acr m sp
> ""
> "m" n f sg
> "m" n acr m sp
> ""
> "km" n acr m sp
> ""
> "l" n m sp
> "l" n f sg
> ""
> "dl" n m sp
> ""
> "ml" n m sp
> ""
> "s" n f sg
> "<.>"
> "." sent
>
> Cada vegada que es fa un traductor a o del català, cal anar esbrinant com
> està codificada cada unitat de mesura. N'he creat les més habituals com a
> n.acr.m.sp:
> * n: perquè són noms i aquesta informació ajuda a la desambiguació
> * acr: perquè són acrònims
> * m: perquè les unitats que he posat són de gènere masculí (metres, grams,
> litres i derivats)
> * sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
> Trobo que és millor incloure les dades morfològiques (part de l'oració,
> gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la
> generació del gènere i nombre convenient (per tant és millot que "acr"
> sense més).
>
> No he esborrat res del que hi havia per no fer mal a ningú, però no seria
> sobrer fer neteja alguna vegada.
>
> Cordialment,
> Hèctor
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


[Apertium-catala] Acrònims per a unitats

2019-06-08 Thread Hèctor Alòs i Font
Tenim un petit cacau amb les unitats del tipus g, kg, m, km, l, ml, etc.:

echo "g mg kg mm cm m km l dl ml s" | apertium -d . cat-disam
""
"g" n f sg
""
"mg" n m sp
""
"kg" n m sp
""
"mm" n m sp
""
"cm" n acr m sp
""
"m" n f sg
"m" n acr m sp
""
"km" n acr m sp
""
"l" n m sp
"l" n f sg
""
"dl" n m sp
""
"ml" n m sp
""
"s" n f sg
"<.>"
"." sent

Cada vegada que es fa un traductor a o del català, cal anar esbrinant com
està codificada cada unitat de mesura. N'he creat les més habituals com a
n.acr.m.sp:
* n: perquè són noms i aquesta informació ajuda a la desambiguació
* acr: perquè són acrònims
* m: perquè les unitats que he posat són de gènere masculí (metres, grams,
litres i derivats)
* sp: perquè no hi ha diferència de nombre en "m", "kg", etc.
Trobo que és millor incloure les dades morfològiques (part de l'oració,
gènere i nombre) perquè ajuda tant a la desambiguació morfològica com a la
generació del gènere i nombre convenient (per tant és millot que "acr"
sense més).

No he esborrat res del que hi havia per no fer mal a ningú, però no seria
sobrer fer neteja alguna vegada.

Cordialment,
Hèctor
___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala