Missatge de Jaume Ortolà i Font <jaumeort...@gmail.com> del dia dv., 14 de febr. 2020 a les 11:31:
> Missatge de Hèctor Alòs i Font <hectora...@gmail.com> del dia dv., 14 de > febr. 2020 a les 7:01: > >> De tota manera, aquí és més complicat que el cas del sistema per detectar >> antropònims desconeguts d'apertium-cat. El problema és que coses com >> Sainte-Marie-de-Gosse són quatre paraules perquè el guionet es tracta com a >> separador de paraules. Per tant, seguint la mateixa idea, caldria marcar >> totes quatre paraules per a impedir-ne la traducció. A més, per a més >> seguretat, voldria assegurar-me que el separador de paraules és un guionet >> i no un blanc, i no sé com accedir a aquesta informació en CG. Caldrà >> demanar-li-ho a en Tino (per la mateixa raó, no sé com canviar el guionet a >> un blanc en coses com "rue Victor-Hugo"). >> > > Jo ho vaig fer servir en el fitxer spa.rlx.[1] Els caràcters que no entren > dins dels tokens (p. ex. guions i guionets) queden en un espai que es diu > "meta". > > [1] > https://github.com/apertium/apertium-spa/blob/master/apertium-spa.spa.rlx#L231 > Perfecte! És justament el que buscava. Moltes gràcies! Hèctor
_______________________________________________ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala