He detectat que de vegades paraules corrents es tradueixen malament en documents .docx (de Microsoft Word). La culpa del problema són divisions enmig de les paraules, volguts (p.e. una paraula mig en cursiva) o espuris (generats per Word). He fet un petit programa en Python que reemplaça un script d'awk dins /usr/local/bin/apertium. Si detecta una paraula migpartida entre dos o més tags, l'agrupa tota en el primer i esborra els eventuals tags superflus. El resultat de la traducció és millor que l'original.
-- Joan Moratinos jmorati...@gmail.com
_______________________________________________ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala