He detectat que de vegades paraules corrents es tradueixen malament en
documents .docx (de Microsoft Word). La culpa del problema són divisions
enmig de les paraules, volguts (p.e. una paraula mig en cursiva) o espuris
(generats per Word). He fet un petit programa en Python que reemplaça un
script d'awk dins /usr/local/bin/apertium. Si detecta una paraula
migpartida entre dos o més tags, l'agrupa tota en el primer i esborra els
eventuals tags superflus. El resultat de la traducció és millor que
l'original.


-- 
Joan Moratinos
jmorati...@gmail.com
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to