Missatge de Hèctor Alòs i Font <hectora...@gmail.com> del dia dv., 14 de febr. 2020 a les 7:01:
> De tota manera, aquí és més complicat que el cas del sistema per detectar > antropònims desconeguts d'apertium-cat. El problema és que coses com > Sainte-Marie-de-Gosse són quatre paraules perquè el guionet es tracta com a > separador de paraules. Per tant, seguint la mateixa idea, caldria marcar > totes quatre paraules per a impedir-ne la traducció. A més, per a més > seguretat, voldria assegurar-me que el separador de paraules és un guionet > i no un blanc, i no sé com accedir a aquesta informació en CG. Caldrà > demanar-li-ho a en Tino (per la mateixa raó, no sé com canviar el guionet a > un blanc en coses com "rue Victor-Hugo"). > Jo ho vaig fer servir en el fitxer spa.rlx.[1] Els caràcters que no entren dins dels tokens (p. ex. guions i guionets) queden en un espai que es diu "meta". [1] https://github.com/apertium/apertium-spa/blob/master/apertium-spa.spa.rlx#L231 En resum, per a topònims i antropònims, crec que val la pena afegir-los > massivament als diccionaris, especialment quan tractes llengües mínimament > més distants que el català i el castellà. > Per mi, avant. Afegeix el que creguis necessari. No serà un problema per als altres parells. Jaume Ortolà
_______________________________________________ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala