Re: [Apertium-catala] Problemes traduint documents .docx
Bon dia, Sóc Donís, el coordinador, per part de la Conselleria, del programa salt, basat en Apertium, com bé sabeu. Com ha dit Jaume, des de la Conselleria d'Educació estem molt interessats en aquest tema. Jaume i jo n'hem parlat moltes vegades, és un dels problemes que la gent tira més en cara del nou Salt. Hauríem de mirar com es pot aplicar aquest script, ja que seria una millora molt important per al programa. Salutacions Donís Seguí Missatge de Jaume Ortolà i Font del dia dt., 30 d’abr. 2019 a les 15:58: > Joan, > > Ho he provat amb un cas senzill de cursiva enmig de paraula i efectivament > fa bé la traducció, cosa que no passa en la versió actual d'Apertium. > Si es pogués incorporar aquesta millora, seria un avantatge important per > a tothom. Via 'pull request' potser? > > Salutacions, > Jaume Ortolà > > > > Missatge de Joan Moratinos Jaume del dia dt., 30 > d’abr. 2019 a les 12:47: > >> Ho pots provar a https://apertium.jmoratinos.com/dev/ >> >> On Tue, 30 Apr 2019 at 12:44, Jaume Ortolà i Font >> wrote: >> >>> Bon dia, Joan. >>> >>> Això pot ser molt interessant. Sé que hi havia gent desesperada amb >>> aquest problema, i que necessitaven urgentment solucions. Per exemple, a la >>> conselleria de cultura de la Generalitat valenciana, però supose que és una >>> necessitat general per a tota la comunitat d'Apertium. >>> >>> Jo no hi estic implicat directament, i no sé si ja ho tenen resolt. >>> Tampoc no sé fins a quin punt pot ajudar la teua solució. Com ho podríem >>> provar? >>> >>> Segur que hi ha gent de la llista que està al corrent de la qüestió. >>> >>> Salutacions, >>> Jaume Ortolà >>> >>> Missatge de Joan Moratinos Jaume del dia dt., 30 >>> d’abr. 2019 a les 12:36: >>> He detectat que de vegades paraules corrents es tradueixen malament en documents .docx (de Microsoft Word). La culpa del problema són divisions enmig de les paraules, volguts (p.e. una paraula mig en cursiva) o espuris (generats per Word). He fet un petit programa en Python que reemplaça un script d'awk dins /usr/local/bin/apertium. Si detecta una paraula migpartida entre dos o més tags, l'agrupa tota en el primer i esborra els eventuals tags superflus. El resultat de la traducció és millor que l'original. -- Joan Moratinos jmorati...@gmail.com ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala >>> >> >> -- >> Joan Moratinos >> jmorati...@gmail.com >> > ___ > Apertium-catala mailing list > Apertium-catala@lists.sourceforge.net > https://lists.sourceforge.net/lists/listinfo/apertium-catala > ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
Re: [Apertium-catala] Problemes traduint documents .docx
Joan, Ho he provat amb un cas senzill de cursiva enmig de paraula i efectivament fa bé la traducció, cosa que no passa en la versió actual d'Apertium. Si es pogués incorporar aquesta millora, seria un avantatge important per a tothom. Via 'pull request' potser? Salutacions, Jaume Ortolà Missatge de Joan Moratinos Jaume del dia dt., 30 d’abr. 2019 a les 12:47: > Ho pots provar a https://apertium.jmoratinos.com/dev/ > > On Tue, 30 Apr 2019 at 12:44, Jaume Ortolà i Font > wrote: > >> Bon dia, Joan. >> >> Això pot ser molt interessant. Sé que hi havia gent desesperada amb >> aquest problema, i que necessitaven urgentment solucions. Per exemple, a la >> conselleria de cultura de la Generalitat valenciana, però supose que és una >> necessitat general per a tota la comunitat d'Apertium. >> >> Jo no hi estic implicat directament, i no sé si ja ho tenen resolt. >> Tampoc no sé fins a quin punt pot ajudar la teua solució. Com ho podríem >> provar? >> >> Segur que hi ha gent de la llista que està al corrent de la qüestió. >> >> Salutacions, >> Jaume Ortolà >> >> Missatge de Joan Moratinos Jaume del dia dt., 30 >> d’abr. 2019 a les 12:36: >> >>> He detectat que de vegades paraules corrents es tradueixen malament en >>> documents .docx (de Microsoft Word). La culpa del problema són divisions >>> enmig de les paraules, volguts (p.e. una paraula mig en cursiva) o espuris >>> (generats per Word). He fet un petit programa en Python que reemplaça un >>> script d'awk dins /usr/local/bin/apertium. Si detecta una paraula >>> migpartida entre dos o més tags, l'agrupa tota en el primer i esborra els >>> eventuals tags superflus. El resultat de la traducció és millor que >>> l'original. >>> >>> >>> -- >>> Joan Moratinos >>> jmorati...@gmail.com >>> ___ >>> Apertium-catala mailing list >>> Apertium-catala@lists.sourceforge.net >>> https://lists.sourceforge.net/lists/listinfo/apertium-catala >>> >> > > -- > Joan Moratinos > jmorati...@gmail.com > ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
Re: [Apertium-catala] Problemes traduint documents .docx
Bon dia, Joan. Això pot ser molt interessant. Sé que hi havia gent desesperada amb aquest problema, i que necessitaven urgentment solucions. Per exemple, a la conselleria de cultura de la Generalitat valenciana, però supose que és una necessitat general per a tota la comunitat d'Apertium. Jo no hi estic implicat directament, i no sé si ja ho tenen resolt. Tampoc no sé fins a quin punt pot ajudar la teua solució. Com ho podríem provar? Segur que hi ha gent de la llista que està al corrent de la qüestió. Salutacions, Jaume Ortolà Missatge de Joan Moratinos Jaume del dia dt., 30 d’abr. 2019 a les 12:36: > He detectat que de vegades paraules corrents es tradueixen malament en > documents .docx (de Microsoft Word). La culpa del problema són divisions > enmig de les paraules, volguts (p.e. una paraula mig en cursiva) o espuris > (generats per Word). He fet un petit programa en Python que reemplaça un > script d'awk dins /usr/local/bin/apertium. Si detecta una paraula > migpartida entre dos o més tags, l'agrupa tota en el primer i esborra els > eventuals tags superflus. El resultat de la traducció és millor que > l'original. > > > -- > Joan Moratinos > jmorati...@gmail.com > ___ > Apertium-catala mailing list > Apertium-catala@lists.sourceforge.net > https://lists.sourceforge.net/lists/listinfo/apertium-catala > ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala
[Apertium-catala] Problemes traduint documents .docx
He detectat que de vegades paraules corrents es tradueixen malament en documents .docx (de Microsoft Word). La culpa del problema són divisions enmig de les paraules, volguts (p.e. una paraula mig en cursiva) o espuris (generats per Word). He fet un petit programa en Python que reemplaça un script d'awk dins /usr/local/bin/apertium. Si detecta una paraula migpartida entre dos o més tags, l'agrupa tota en el primer i esborra els eventuals tags superflus. El resultat de la traducció és millor que l'original. -- Joan Moratinos jmorati...@gmail.com ___ Apertium-catala mailing list Apertium-catala@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-catala