Re: [Apertium-catala] Fwd: Noms propis

2018-04-14 Thread Marc Riera Irigoyen
Hola,

Personalment no m'acaben d'agradar les marques  perquè per desgràcia
sempre me les trobo quan donen problemes, però són una opció totalment
vàlida sempre que s'entengui bé el seu funcionament i les limitacions que
tenen. Si una marca d'aquestes dóna problemes perquè no coincideixen al
100% les etiquetes entre dues llengües, la millor solució sempre hauria de
ser desdoblar l'entrada en qüestió en  i  i tractar la discrepància
al diccionari bilingüe i no afegir variants en un dels diccionaris
monolingües per acceptar el que hi ha a l'altre.

Estic d'acord que és una feina generalment poc productiva, però en el cas
del parell anglès-català, per exemple, on en un dels dos costats no hi ha
informació de gènere, la diferència es nota.

Salutacions,

Marc

El dia 14 d’abril de 2018 a les 13:14, Jaume Ortolà i Font <
jaumeort...@gmail.com> ha escrit:

> Gràcies, Marc. Me'n faig una idea.
>
> Els noms propis, per desgràcia, donen molta feina, però aquesta feina és
> poc productiva. Hi ha poques vegades en què realment calgui la informació
> de les etiquetes.
>
> Entrant en el cas espanyol-català, ¿suggereixes que valdria més eliminar
> les marques d'invariable ?
>
> En els casos difícils, a més d'etiquetar-ho tot bé, cal fer desambiguació.
> Veig que ja es fan coses. Per exemple, "Jaime Martínez, Jaime I, en
> Zaragoza, Juan Zaragoza" es tradueix correctament per "Jaime Martínez,
> Jaume I, a Saragossa, Juan Zaragoza".
>
> Salutacions,
> Jaume Ortolà
>
>
> El dia 13 d’abril de 2018 a les 14:04, Marc Riera Irigoyen <
> marc.riera.irigo...@gmail.com> ha escrit:
>
>> Hola Jaume,
>>
>> Al diccionari monolingüe català queden uns 450 noms propis de a categoria
>> "altres" pendents de classificar (si algú s'hi vol animar, són aquí [1], al
>> cinquè full).
>>
>> Sobre les etiquetes, crec que la confusió ve principalment de la
>> (des)organització del diccionari bilingüe castellà-català. Hi ha
>> moltíssimes entrades, com les del missatge de Donís Seguí, que estan
>> definides com a invariables (), per la qual cosa Apertium busca el
>> mateix lema amb les mateixes etiquetes a tots dos costats. Si coincideix
>> tot no hi ha problema, però a la mínima que hi ha un canvi a un dels dos
>> monolingües (com ha passat amb el català) l'entrada queda trencada.
>>
>> A part d'això, com bé has dit, hi ha diferents criteris pel que fa a les
>> etiquetes que cal especificar a les entrades del diccionari bilingüe. Jo
>> sóc partidari d'especificar el màxim d'etiquetes possible per evitar
>> problemes inesperats. Poso un exemple amb el nom propi "Núria", que pot ser
>> un antropònim o un topònim:
>>
>> NúriaNúria
>>
>> Amb una entrada així, Apertium transfereix totes les etiquetes darrere de
>>  d'un costat a l'altre. Si "Núria" existeix en català com a
>> , Apertium cercarà en castellà el mateix, i funcionaria. El
>> problema apareixeria si s'afegís "Núria" com a topònim en català
>> (), perquè Apertium el transferiria al castellà per aquesta
>> mateixa entrada. Com que només hi ha especificada l'etiqueta ,
>> qualsevol cosa que sigui "Núria" i tingui aquesta etiqueta en primera
>> posició es transferiria. Per tant, és molt important especificar més
>> etiquetes, com per exemple:
>>
>> NúriaNúria> n="ant"/>
>>
>> Amb una entrada així, només es transferiria l'antropònim. Si després es
>> volgués afegir el topònim, només caldria afegir una altra entrada:
>>
>> NúriaNúria> n="top"/>
>>
>> D'aquesta manera no hi hauria conflictes entre els dos tipus de nom propi
>> i es podria ajustar millor la traducció.
>>
>> Marc
>>
>>
>>
>> [1] https://docs.google.com/spreadsheets/d/19eFQ2xS6bItbCUxUtPNk
>> -bMBRPIMKzLR1oY6d0t84_M/edit?usp=sharing
>>
>> El dia 13 d’abril de 2018 a les 13:30, Jaume Ortolà i Font <
>> jaumeort...@gmail.com> ha escrit:
>>
>>> Bon dia,
>>>
>>> Donís Seguí, que fa contribucions al parell espanyol-català, m'envia
>>> aquesta qüestió sobre noms propis. Copie el missatge més avall. ¿Algú pot
>>> explicar com està tot això ara mateix? Quins criteris s'han de seguir, què
>>> està pendent de fer, etc. Ni tan sols estic segur del significat de totes
>>> les etiquetes que es fan servir.
>>>
>>> També tinc altres dubtes sobre noms propis. Tenen relació amb els que
>>> queden pendents en el testvoc spa-cat.[1] ¿Quins criteris convé seguir?
>>> Entenc que els noms de persones en general no els traduïm, siga Pedro,
>>> Juan... o Pere, Joan... Però hi ha molts casos problemàtics o dubtosos. Els
>>> noms propis de persona poden coincidir amb topònims o amb noms comuns o
>>> altres coses: Nuria, Victoria, Gracia, Olimpia, Penedés... ¿Es poden
>>> establir unes orientacions generals o simplement hem de posar el que
>>> intuïtivament tinga més sentit en cada cas?
>>>
>>> Salutacions,
>>> Jaume Ortolà
>>>
>>> [1] https://github.com/apertium/apertium-spa-cat/blob/master
>>> /dev/testvoc.spa-cat.txt
>>>
>>>
>>> -- Missatge reenviat --
>>> De: Donís 
>>> Data: 13 d’abril de 2018 a les 13:11
>>> Assumpte: 

Re: [Apertium-catala] Fwd: Noms propis

2018-04-14 Thread Jaume Ortolà i Font
Gràcies, Marc. Me'n faig una idea.

Els noms propis, per desgràcia, donen molta feina, però aquesta feina és
poc productiva. Hi ha poques vegades en què realment calgui la informació
de les etiquetes.

Entrant en el cas espanyol-català, ¿suggereixes que valdria més eliminar
les marques d'invariable ?

En els casos difícils, a més d'etiquetar-ho tot bé, cal fer desambiguació.
Veig que ja es fan coses. Per exemple, "Jaime Martínez, Jaime I, en
Zaragoza, Juan Zaragoza" es tradueix correctament per "Jaime Martínez,
Jaume I, a Saragossa, Juan Zaragoza".

Salutacions,
Jaume Ortolà


El dia 13 d’abril de 2018 a les 14:04, Marc Riera Irigoyen <
marc.riera.irigo...@gmail.com> ha escrit:

> Hola Jaume,
>
> Al diccionari monolingüe català queden uns 450 noms propis de a categoria
> "altres" pendents de classificar (si algú s'hi vol animar, són aquí [1], al
> cinquè full).
>
> Sobre les etiquetes, crec que la confusió ve principalment de la
> (des)organització del diccionari bilingüe castellà-català. Hi ha
> moltíssimes entrades, com les del missatge de Donís Seguí, que estan
> definides com a invariables (), per la qual cosa Apertium busca el
> mateix lema amb les mateixes etiquetes a tots dos costats. Si coincideix
> tot no hi ha problema, però a la mínima que hi ha un canvi a un dels dos
> monolingües (com ha passat amb el català) l'entrada queda trencada.
>
> A part d'això, com bé has dit, hi ha diferents criteris pel que fa a les
> etiquetes que cal especificar a les entrades del diccionari bilingüe. Jo
> sóc partidari d'especificar el màxim d'etiquetes possible per evitar
> problemes inesperats. Poso un exemple amb el nom propi "Núria", que pot ser
> un antropònim o un topònim:
>
> NúriaNúria
>
> Amb una entrada així, Apertium transfereix totes les etiquetes darrere de
>  d'un costat a l'altre. Si "Núria" existeix en català com a
> , Apertium cercarà en castellà el mateix, i funcionaria. El
> problema apareixeria si s'afegís "Núria" com a topònim en català
> (), perquè Apertium el transferiria al castellà per aquesta
> mateixa entrada. Com que només hi ha especificada l'etiqueta ,
> qualsevol cosa que sigui "Núria" i tingui aquesta etiqueta en primera
> posició es transferiria. Per tant, és molt important especificar més
> etiquetes, com per exemple:
>
> NúriaNúria n="ant"/>
>
> Amb una entrada així, només es transferiria l'antropònim. Si després es
> volgués afegir el topònim, només caldria afegir una altra entrada:
>
> NúriaNúria n="top"/>
>
> D'aquesta manera no hi hauria conflictes entre els dos tipus de nom propi
> i es podria ajustar millor la traducció.
>
> Marc
>
>
>
> [1] https://docs.google.com/spreadsheets/d/19eFQ2xS6bItbCUxUtPNk-
> bMBRPIMKzLR1oY6d0t84_M/edit?usp=sharing
>
> El dia 13 d’abril de 2018 a les 13:30, Jaume Ortolà i Font <
> jaumeort...@gmail.com> ha escrit:
>
>> Bon dia,
>>
>> Donís Seguí, que fa contribucions al parell espanyol-català, m'envia
>> aquesta qüestió sobre noms propis. Copie el missatge més avall. ¿Algú pot
>> explicar com està tot això ara mateix? Quins criteris s'han de seguir, què
>> està pendent de fer, etc. Ni tan sols estic segur del significat de totes
>> les etiquetes que es fan servir.
>>
>> També tinc altres dubtes sobre noms propis. Tenen relació amb els que
>> queden pendents en el testvoc spa-cat.[1] ¿Quins criteris convé seguir?
>> Entenc que els noms de persones en general no els traduïm, siga Pedro,
>> Juan... o Pere, Joan... Però hi ha molts casos problemàtics o dubtosos. Els
>> noms propis de persona poden coincidir amb topònims o amb noms comuns o
>> altres coses: Nuria, Victoria, Gracia, Olimpia, Penedés... ¿Es poden
>> establir unes orientacions generals o simplement hem de posar el que
>> intuïtivament tinga més sentit en cada cas?
>>
>> Salutacions,
>> Jaume Ortolà
>>
>> [1] https://github.com/apertium/apertium-spa-cat/blob/master
>> /dev/testvoc.spa-cat.txt
>>
>>
>> -- Missatge reenviat --
>> De: Donís 
>> Data: 13 d’abril de 2018 a les 13:11
>> Assumpte: Noms propis
>> Per a: Jaume Ortolà i Font 
>>
>>
>> Bon dia, Jaume, estem preparant una bona llista de noms propis, i hem
>> vist que hi ha divergència de criteris. Mira estos casos
>>
>> *En estos antropònims:*
>>Adoración
>>Albentosa
>>Afrodita
>>AlCapone
>>
>>
>> *Ens estos topònims, en un posa que és "np" i en l'altre que és "ant" o
>> "top"*
>>AlbalatdelsTarongers
>>Albalat
>>Daimús
>>Dajla
>>
>> *En noms propis diversos:*
>>CiutatdelesArtsilesCiencies> *n="np"/>
>> GovernValenciàGovernValencià> *"np"/>*
>>
>>
>> 
>> --
>> Check out the vibrant tech community on one of the world's most
>> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
>> ___
>> Apertium-catala mailing list
>> Apertium-catala@lists.sourceforge.net
>>