Bon dia,

Em pregunte si seria possible de fer algunes regles per al tractament de
noms de persona (noms i cognoms). Per més cognoms que afegim als
diccionaris, sempre n'hi haurà més. I el perill de traduir un cognom sempre
està present. Acabe de fer una prova spa-cat amb una llista de 100 persones
(nom i cognoms), i han eixit 14 traduccions falses, per diferents motius
(alguns són topònims, paraules comunes, etc.) És un percentatge molt alt.

Almeria
Cirerer (Cerezo)
Desemparats
Plàcida
Os (Hueso)
Muntanyès
el Campello (per Campello)
Còrdova
Diumenge roig (Domingo Rojo)
Savina
Francès
Va talar (Taló)
Juan de Déu
Pujaves (Subías)
Remeie (Remedio)

Una solució és, evidentment, continuar afegint noms i cognoms als
diccionaris i etiquetar-los correctament. Però això no s'acaba mai. Crec
que es podrien fer algunes regles per a arreglar-ho. Conceptualment és
senzill, però no sé si es pot implementar fàcilment.

Si es troben 3-4 paraules seguides en majúscules, que són paraules
desconegudes o barrejades amb noms propis, llavors no s'hauria de traduir
cap paraula del grup i deixar-ho tal qual.

O altres regles, ara pensant en paraules soltes. Per exemple, una paraula
que només pot ser un verb (Subías, Taló, en espanyol) si està en majúscula
en qualsevol lloc que no siga el principi de la frase, llavors no es
tradueix. Etcètera.

¿Trobeu que té sentit fer aquestes regles? Ara, ¿es poden implementar? ¿En
quin mòdul? Caldria poder detectar paraules en majúscula i indicar amb
alguna marca "no traduïsques".

Salutacions,
Jaume Ortolà
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to