Jaume,

El que proposes em sembla perillós. Si ho entenc bé la idea, al cap i a la
fi, sembla que seria no traduir les paraules que comencen amb majúscula si
van més o menys seguides d'altres amb majúscula (o seria obligatòriament en
presència d'alguna paraula desconeguda que també va en majúscula?). El
problema és que això fàcilment acabarà fent que Creu Roja o Alps
Escandinaus o potser fins i tot Pirineus no es tradueixin. Per altra banda,
hi ha el problema que Domingo Rojo pot ser un nom de persona, però també un
fet històric. A més, si s'accepten coses com "Juan de Dios" com una unitat,
el sistema per reconèixer antropònims per no traduir-los pot començar a
agafar moltes coses que no ho són, per exemple Joan d'Àustria seguirà sent
Joan d'Àustria i no Juan de Austria. Jo, conceptualment, no ho veig gens
clar.

A priori, però, la manera d'implementar coses d'aquestes sembla que sigui
CG. Allà hi ha regles que tracten paraules començades per majúscula. El que
hi ha fins ara, però, és triar o eliminar anàlisis existents. Aquí caldria
afegir alguna cosa que no hi és.

En tot cas, a una setmana de posar en marxa una nova versió, sembla que
estem parlant d'un canvi molt important que s'hauria de provar a fons.
Potser que no sigui el moment de fer-ho ara per a aquesta versió.

Cordialment,
Hèctor

El dia 24 d’abril de 2018 a les 15:28, Jaume Ortolà i Font <
jaumeort...@gmail.com> ha escrit:

> Bon dia,
>
> Em pregunte si seria possible de fer algunes regles per al tractament de
> noms de persona (noms i cognoms). Per més cognoms que afegim als
> diccionaris, sempre n'hi haurà més. I el perill de traduir un cognom sempre
> està present. Acabe de fer una prova spa-cat amb una llista de 100 persones
> (nom i cognoms), i han eixit 14 traduccions falses, per diferents motius
> (alguns són topònims, paraules comunes, etc.) És un percentatge molt alt.
>
> Almeria
> Cirerer (Cerezo)
> Desemparats
> Plàcida
> Os (Hueso)
> Muntanyès
> el Campello (per Campello)
> Còrdova
> Diumenge roig (Domingo Rojo)
> Savina
> Francès
> Va talar (Taló)
> Juan de Déu
> Pujaves (Subías)
> Remeie (Remedio)
>
> Una solució és, evidentment, continuar afegint noms i cognoms als
> diccionaris i etiquetar-los correctament. Però això no s'acaba mai. Crec
> que es podrien fer algunes regles per a arreglar-ho. Conceptualment és
> senzill, però no sé si es pot implementar fàcilment.
>
> Si es troben 3-4 paraules seguides en majúscules, que són paraules
> desconegudes o barrejades amb noms propis, llavors no s'hauria de traduir
> cap paraula del grup i deixar-ho tal qual.
>
> O altres regles, ara pensant en paraules soltes. Per exemple, una paraula
> que només pot ser un verb (Subías, Taló, en espanyol) si està en majúscula
> en qualsevol lloc que no siga el principi de la frase, llavors no es
> tradueix. Etcètera.
>
> ¿Trobeu que té sentit fer aquestes regles? Ara, ¿es poden implementar? ¿En
> quin mòdul? Caldria poder detectar paraules en majúscula i indicar amb
> alguna marca "no traduïsques".
>
> Salutacions,
> Jaume Ortolà
>
>
> ------------------------------------------------------------
> ------------------
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> _______________________________________________
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
>
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to