Missatge de Hèctor Alòs i Font <hectora...@gmail.com> del dia dv., 14 de
febr. 2020 a les 7:01:

> De tota manera, aquí és més complicat que el cas del sistema per detectar
> antropònims desconeguts d'apertium-cat. El problema és que coses com
> Sainte-Marie-de-Gosse són quatre paraules perquè el guionet es tracta com a
> separador de paraules. Per tant, seguint la mateixa idea, caldria marcar
> totes quatre paraules per a impedir-ne la traducció. A més, per a més
> seguretat, voldria assegurar-me que el separador de paraules és un guionet
> i no un blanc, i no sé com accedir a aquesta informació en CG. Caldrà
> demanar-li-ho a en Tino (per la mateixa raó, no sé com canviar el guionet a
> un blanc en coses com "rue Victor-Hugo").
>

Jo ho vaig fer servir en el fitxer spa.rlx.[1] Els caràcters que no entren
dins dels tokens (p. ex. guions i guionets) queden en un espai que es diu
"meta".

[1]
https://github.com/apertium/apertium-spa/blob/master/apertium-spa.spa.rlx#L231

En resum, per a topònims i antropònims, crec que val la pena afegir-los
> massivament als diccionaris, especialment quan tractes llengües mínimament
> més distants que el català i el castellà.
>

Per mi, avant. Afegeix el que creguis necessari. No serà un problema per
als altres parells.

Jaume Ortolà
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to