[G11n] Glosarios informatica en galego en formato TBX

2009-09-23 Thread Leandro Regueiro
http://ghicho.iespana.es/glosarios_vocabularios_informatica_galego_TBX.zip

Ata logo,
Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-09-23 Thread Manuel Vázquez
Ola:
Non vai este enderezo...
Saúdos:
Manuel A. Vázquez

2009/9/23 Leandro Regueiro 

> http://ghicho.iespana.es/glosarios_vocabularios_informatica_galego_TBX.zip
>
> Ata logo,
> Leandro Regueiro
> ___
> G11n mailing list
> G11n en mancomun.org
> http://listas.mancomun.org/mailman/listinfo/g11n
>
 próxima parte 
Borrouse un adxunto en formato HTML...
URL: 
http://listas.mancomun.org/pipermail/g11n/attachments/20090923/eb87ad46/attachment.htm
 


[G11n] Glosarios informatica en galego en formato TBX

2009-09-23 Thread Méixome
Se o pos así si que vai, que cousas...

http://ghicho.iespana.es/


Manuel Vázquez escribiu:
> Ola:
> Non vai este enderezo...
> Saúdos:
> Manuel A. Vázquez
>
> 2009/9/23 Leandro Regueiro  >
>
> http://ghicho.iespana.es/glosarios_vocabularios_informatica_galego_TBX.zip
>
> Ata logo,
>Leandro Regueiro
> ___
> G11n mailing list
> G11n en mancomun.org 
> http://listas.mancomun.org/mailman/listinfo/g11n
>
>
> 
>
> ___
> G11n mailing list
> G11n en mancomun.org
> http://listas.mancomun.org/mailman/listinfo/g11n
>   



[G11n] Glosarios informatica en galego en formato TBX

2009-09-29 Thread Leandro Regueiro
Así aos poucos conseguín montar un script que colle ese ficheiros TBX
e os mete todos xuntos nunha mesma base de datos, e despois fixen
outro script para consultar a base de datos. O da consulta é bastante
trapalleiro, pero supoño que outra xente con ansias pode arranxalo
algo ou indicar ideas ou mesmo facer unha interface gráfica. Agora non
teño tempo, pero envíovolo dentro duns poucos días.

Ata logo,
Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-09-30 Thread Leandro Regueiro
É raro, pero o outro día rulábame ca ligazón directa, en todo caso con
http://ghicho.iespana.es/ si que funciona.

Como prometín no anexo vai un arquivo con tres ficheiros: un de
instrucións, un script que xera a base de datos a partir dos ficheiros
TBX que se poden baixar da páxina de enriba, e outro script que
permite realizar consultas dende unha terminal.

PD: acábome de dar conta de que o código do xerador inclúe unha
referencia a un ficheiro TBX que me pasou Marce e que metin para
probar e de paso ter máis terminoloxía na base de datos, así que pode
que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente
eliminade a liña referente ao glosario de Marce do dicionario que está
cara o final do código do script xerador.

Ata logo,
  Leandro Regueiro
 próxima parte 
Borrouse unha mensaxe que non está en formato texto plano...
Nome : scripts_para_crear_e_consultar_bd_glosarios.tar.gz
Tipo   : application/x-gzip
Tamaño : 4632 bytes
Descrición: non dispoñible
Url: 
http://listas.mancomun.org/pipermail/g11n/attachments/20090930/c7d2db11/attachment.bin
 


[G11n] Glosarios informatica en galego en formato TBX

2009-09-30 Thread Leandro Regueiro
> É raro, pero o outro día rulábame ca ligazón directa, en todo caso con
> http://ghicho.iespana.es/ si que funciona.
>
> Como prometín no anexo vai un arquivo con tres ficheiros: un de
> instrucións, un script que xera a base de datos a partir dos ficheiros
> TBX que se poden baixar da páxina de enriba, e outro script que
> permite realizar consultas dende unha terminal.
>
> PD: acábome de dar conta de que o código do xerador inclúe unha
> referencia a un ficheiro TBX que me pasou Marce e que metin para
> probar e de paso ter máis terminoloxía na base de datos, así que pode
> que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente
> eliminade a liña referente ao glosario de Marce do dicionario que está
> cara o final do código do script xerador.

Evidentemente cando teñamos rematado ese sistema de xestión de
terminoloxía o uso desta ferramenta será útil para obter as propostas
dos diferentes glosarios existentes ata o de agora e consideralas
durante a creación da nova terminoloxía unificada, a cal debería ser a
única que se debería usar nun futuro.

Ou sexa, este sistema é un parche temporal.

Ata logo,
   Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-09-30 Thread Antón Méixome
Leandro Regueiro escribiu:
>> É raro, pero o outro día rulábame ca ligazón directa, en todo caso con
>> http://ghicho.iespana.es/ si que funciona.
>>
>> Como prometín no anexo vai un arquivo con tres ficheiros: un de
>> instrucións, un script que xera a base de datos a partir dos ficheiros
>> TBX que se poden baixar da páxina de enriba, e outro script que
>> permite realizar consultas dende unha terminal.
>>
>> PD: acábome de dar conta de que o código do xerador inclúe unha
>> referencia a un ficheiro TBX que me pasou Marce e que metin para
>> probar e de paso ter máis terminoloxía na base de datos, así que pode
>> que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente
>> eliminade a liña referente ao glosario de Marce do dicionario que está
>> cara o final do código do script xerador.
>> 
>
> Evidentemente cando teñamos rematado ese sistema de xestión de
> terminoloxía o uso desta ferramenta será útil para obter as propostas
> dos diferentes glosarios existentes ata o de agora e consideralas
> durante a creación da nova terminoloxía unificada, a cal debería ser a
> única que se debería usar nun futuro.
>
> Ou sexa, este sistema é un parche temporal.
>
> Ata logo,
>Leandro Regueiro
> ___
> G11n mailing list
> G11n en mancomun.org
> http://listas.mancomun.org/mailman/listinfo/g11n
>
>   
Chámalle "documentar" a escolla.

-- 
Antón Gómez Méixome  .:lingüista:.  www.mancomun.org 
Centro de Referencia e Servizos de Software Libre 
Avda. de Vigo, s/n 15706   Santiago de Compostela  
Tel/ Fax: (0034) 981 56 98 10/ 981 59 46 16 



[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Leandro Regueiro
>>> É raro, pero o outro día rulábame ca ligazón directa, en todo caso con
>>> http://ghicho.iespana.es/ si que funciona.
>>>
>>> Como prometín no anexo vai un arquivo con tres ficheiros: un de
>>> instrucións, un script que xera a base de datos a partir dos ficheiros
>>> TBX que se poden baixar da páxina de enriba, e outro script que
>>> permite realizar consultas dende unha terminal.
>>>
>>> PD: acábome de dar conta de que o código do xerador inclúe unha
>>> referencia a un ficheiro TBX que me pasou Marce e que metin para
>>> probar e de paso ter máis terminoloxía na base de datos, así que pode
>>> que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente
>>> eliminade a liña referente ao glosario de Marce do dicionario que está
>>> cara o final do código do script xerador.
>>
>> Evidentemente cando teñamos rematado ese sistema de xestión de
>> terminoloxía o uso desta ferramenta será útil para obter as propostas
>> dos diferentes glosarios existentes ata o de agora e consideralas
>> durante a creación da nova terminoloxía unificada, a cal debería ser a
>> única que se debería usar nun futuro.
>>
>> Ou sexa, este sistema é un parche temporal.
>
> Chámalle "documentar" a escolla.

Vale.

Envíovos unha nova versión que permite indicar as consultas como
exactas ou inexactas. É dicir con

./script --fuzzy tab

obtéñense tódolos resultados tal como se obtiñan antes, só que é
bastante máis lento agora. Co exemplo este obterianse todas as
entradas que teñan algunha tradución en inglés que conteña tab: table,
executable, database, portable...

Ca opción nova:

./script --exact tab

só se obteñen as entradas que teñen algunha tradución en inglés que
conteña "tab" e "tab" non forma parte de ningunha palabra con máis
caracteres. Devolveria "tab order", "tab", "next tab" pero non
"tabulation" nin nada diso.

Lembrade que se pode consultar por frases, con ambos modos:

./script --exact database manager applet

buscaria os resultados usando a cadea "database manager applet".

E lamento o de que o script sexa moito máis lento. Quizais se teño
tempo me dedicarei a ver se consigo que sexa máis rápido, pero non
prometo nada de nada.

Ata logo,
  Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Manuel Souto Pico
Leandro, moitas grazas por compartires e distribuíres eses glosarios e os
scripts, que probarei máis tarde.

Eu tampouco prometo nada de nada, pero fixen una pequena proba con XQuery
para crear unha interface para interrogar directamente os documentos TBX sen
ter que pasalos primeiro a unha base de datos SQL. Teño un formulario de
busca de termos que permite usar expresións regulares: ao buscar un termo,
móstrase unha lista das coincidencias e ao clicar nalgunha, móstrase a ficha
completa correspondente, máis outro formulario para introducir comentarios
(pendente de acabar).

Teño isto no meu servidor local, en eXist, así que non volo podo mostrar de
momento. Estiven mirando e o meu provedor de aloxamento non me permite usar
eXist nin Tamino ou similar, parece que para iso necesito un VPS ou servidor
dedicado ou algo así, que é un pouco caro. Da Forxa tamén me responderon
dicindo que non contemplan instalar ningún sistema de bd XML. Alguén pode
recomendar algunha outra maneira de montar isto?

Como o vedes? Credes que sería útil? Hai tempo que quería facer isto pero
non tiña a materia prima (os glosarios).

Unha aperta,
~manuel


2009/10/5 Leandro Regueiro 

> >>> É raro, pero o outro día rulábame ca ligazón directa, en todo caso con
> >>> http://ghicho.iespana.es/ si que funciona.
> >>>
> >>> Como prometín no anexo vai un arquivo con tres ficheiros: un de
> >>> instrucións, un script que xera a base de datos a partir dos ficheiros
> >>> TBX que se poden baixar da páxina de enriba, e outro script que
> >>> permite realizar consultas dende unha terminal.
> >>>
> >>> PD: acábome de dar conta de que o código do xerador inclúe unha
> >>> referencia a un ficheiro TBX que me pasou Marce e que metin para
> >>> probar e de paso ter máis terminoloxía na base de datos, así que pode
> >>> que a vós non vos rule ben xa que non tedes ese ficheiro. Simplemente
> >>> eliminade a liña referente ao glosario de Marce do dicionario que está
> >>> cara o final do código do script xerador.
> >>
> >> Evidentemente cando teñamos rematado ese sistema de xestión de
> >> terminoloxía o uso desta ferramenta será útil para obter as propostas
> >> dos diferentes glosarios existentes ata o de agora e consideralas
> >> durante a creación da nova terminoloxía unificada, a cal debería ser a
> >> única que se debería usar nun futuro.
> >>
> >> Ou sexa, este sistema é un parche temporal.
> >
> > Chámalle "documentar" a escolla.
>
> Vale.
>
> Envíovos unha nova versión que permite indicar as consultas como
> exactas ou inexactas. É dicir con
>
> ./script --fuzzy tab
>
> obtéñense tódolos resultados tal como se obtiñan antes, só que é
> bastante máis lento agora. Co exemplo este obterianse todas as
> entradas que teñan algunha tradución en inglés que conteña tab: table,
> executable, database, portable...
>
> Ca opción nova:
>
> ./script --exact tab
>
> só se obteñen as entradas que teñen algunha tradución en inglés que
> conteña "tab" e "tab" non forma parte de ningunha palabra con máis
> caracteres. Devolveria "tab order", "tab", "next tab" pero non
> "tabulation" nin nada diso.
>
> Lembrade que se pode consultar por frases, con ambos modos:
>
> ./script --exact database manager applet
>
> buscaria os resultados usando a cadea "database manager applet".
>
> E lamento o de que o script sexa moito máis lento. Quizais se teño
> tempo me dedicarei a ver se consigo que sexa máis rápido, pero non
> prometo nada de nada.
>
> Ata logo,
>  Leandro Regueiro
> ___
> G11n mailing list
> G11n en mancomun.org
> http://listas.mancomun.org/mailman/listinfo/g11n
>
 próxima parte 
Borrouse un adxunto en formato HTML...
URL: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091005/85f51bbb/attachment.htm
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Fran Dieguez
-BEGIN PGP SIGNED MESSAGE-
Hash: SHA1

Ola Manuel,

recoméndoche que primeiro fagas a implementación que logo dos recursos
para facelo accesibel é cuestión de falalo con organizacións que estamos
no mundillo. Coido que se pode meter en algún servidor co que contemos.

Sempre e cando o software sexa liberado claro...

Saúdos.

Manuel Souto Pico escribiu:
> Leandro, moitas grazas por compartires e distribuíres eses glosarios e
> os scripts, que probarei máis tarde.
> 
> Eu tampouco prometo nada de nada, pero fixen una pequena proba con
> XQuery para crear unha interface para interrogar directamente os
> documentos TBX sen ter que pasalos primeiro a unha base de datos SQL.
> Teño un formulario de busca de termos que permite usar expresións
> regulares: ao buscar un termo, móstrase unha lista das coincidencias e
> ao clicar nalgunha, móstrase a ficha completa correspondente, máis outro
> formulario para introducir comentarios (pendente de acabar).
> 
> Teño isto no meu servidor local, en eXist, así que non volo podo mostrar
> de momento. Estiven mirando e o meu provedor de aloxamento non me
> permite usar eXist nin Tamino ou similar, parece que para iso necesito
> un VPS ou servidor dedicado ou algo así, que é un pouco caro. Da Forxa
> tamén me responderon dicindo que non contemplan instalar ningún sistema
> de bd XML. Alguén pode recomendar algunha outra maneira de montar isto?
> 
> Como o vedes? Credes que sería útil? Hai tempo que quería facer isto
> pero non tiña a materia prima (os glosarios).
> 
> Unha aperta,
> ~manuel
> 
> 
> 2009/10/5 Leandro Regueiro  >
> 
> >>> É raro, pero o outro día rulábame ca ligazón directa, en todo
> caso con
> >>> http://ghicho.iespana.es/ si que funciona.
> >>>
> >>> Como prometín no anexo vai un arquivo con tres ficheiros: un de
> >>> instrucións, un script que xera a base de datos a partir dos
> ficheiros
> >>> TBX que se poden baixar da páxina de enriba, e outro script que
> >>> permite realizar consultas dende unha terminal.
> >>>
> >>> PD: acábome de dar conta de que o código do xerador inclúe unha
> >>> referencia a un ficheiro TBX que me pasou Marce e que metin para
> >>> probar e de paso ter máis terminoloxía na base de datos, así que
> pode
> >>> que a vós non vos rule ben xa que non tedes ese ficheiro.
> Simplemente
> >>> eliminade a liña referente ao glosario de Marce do dicionario
> que está
> >>> cara o final do código do script xerador.
> >>
> >> Evidentemente cando teñamos rematado ese sistema de xestión de
> >> terminoloxía o uso desta ferramenta será útil para obter as propostas
> >> dos diferentes glosarios existentes ata o de agora e consideralas
> >> durante a creación da nova terminoloxía unificada, a cal debería
> ser a
> >> única que se debería usar nun futuro.
> >>
> >> Ou sexa, este sistema é un parche temporal.
> >
> > Chámalle "documentar" a escolla.
> 
> Vale.
> 
> Envíovos unha nova versión que permite indicar as consultas como
> exactas ou inexactas. É dicir con
> 
> ./script --fuzzy tab
> 
> obtéñense tódolos resultados tal como se obtiñan antes, só que é
> bastante máis lento agora. Co exemplo este obterianse todas as
> entradas que teñan algunha tradución en inglés que conteña tab: table,
> executable, database, portable...
> 
> Ca opción nova:
> 
> ./script --exact tab
> 
> só se obteñen as entradas que teñen algunha tradución en inglés que
> conteña "tab" e "tab" non forma parte de ningunha palabra con máis
> caracteres. Devolveria "tab order", "tab", "next tab" pero non
> "tabulation" nin nada diso.
> 
> Lembrade que se pode consultar por frases, con ambos modos:
> 
> ./script --exact database manager applet
> 
> buscaria os resultados usando a cadea "database manager applet".
> 
> E lamento o de que o script sexa moito máis lento. Quizais se teño
> tempo me dedicarei a ver se consigo que sexa máis rápido, pero non
> prometo nada de nada.
> 
> Ata logo,
>  Leandro Regueiro
> ___
> G11n mailing list
> G11n en mancomun.org 
> http://listas.mancomun.org/mailman/listinfo/g11n
> 
> 
> 
> 
> 
> ___
> G11n mailing list
> G11n en mancomun.org
> http://listas.mancomun.org/mailman/listinfo/g11n


- --
Fran Diéguez
http://www.mabishu.com - listas en mabishu.com
GPG: 43DD 1B00 035F A764 4986  E695 98BB 6626 A2A4 F9B8


-BEGIN PGP SIGNATURE-
Version: GnuPG v1.4.9 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iEYEARECAAYFAkrJ/msACgkQmLtmJqKk+bg1LQCeOVp0C9UNkbZyW9F2fh7yPpdm
0ksAoIKM2MSxPJUPsDHxZVkc9jSir8NF
=wHbi
-END PGP SIGNATURE

[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Manuel Souto Pico
Grazas, Fran. Avisarei así que teña lista unha versión mínimamente
funcional.

Unha aperta,
~manuel


2009/10/5 Fran Dieguez 

> -BEGIN PGP SIGNED MESSAGE-
> Hash: SHA1
>
> Ola Manuel,
>
> recoméndoche que primeiro fagas a implementación que logo dos recursos
> para facelo accesibel é cuestión de falalo con organizacións que estamos
> no mundillo. Coido que se pode meter en algún servidor co que contemos.
>
> Sempre e cando o software sexa liberado claro...
>
> Saúdos.
>
> Manuel Souto Pico escribiu:
> > Leandro, moitas grazas por compartires e distribuíres eses glosarios e
> > os scripts, que probarei máis tarde.
> >
> > Eu tampouco prometo nada de nada, pero fixen una pequena proba con
> > XQuery para crear unha interface para interrogar directamente os
> > documentos TBX sen ter que pasalos primeiro a unha base de datos SQL.
> > Teño un formulario de busca de termos que permite usar expresións
> > regulares: ao buscar un termo, móstrase unha lista das coincidencias e
> > ao clicar nalgunha, móstrase a ficha completa correspondente, máis outro
> > formulario para introducir comentarios (pendente de acabar).
> >
> > Teño isto no meu servidor local, en eXist, así que non volo podo mostrar
> > de momento. Estiven mirando e o meu provedor de aloxamento non me
> > permite usar eXist nin Tamino ou similar, parece que para iso necesito
> > un VPS ou servidor dedicado ou algo así, que é un pouco caro. Da Forxa
> > tamén me responderon dicindo que non contemplan instalar ningún sistema
> > de bd XML. Alguén pode recomendar algunha outra maneira de montar isto?
> >
> > Como o vedes? Credes que sería útil? Hai tempo que quería facer isto
> > pero non tiña a materia prima (os glosarios).
> >
> > Unha aperta,
> > ~manuel
> >
> >
> > 2009/10/5 Leandro Regueiro  > >
> >
> > >>> É raro, pero o outro día rulábame ca ligazón directa, en todo
> > caso con
> > >>> http://ghicho.iespana.es/ si que funciona.
> > >>>
> > >>> Como prometín no anexo vai un arquivo con tres ficheiros: un de
> > >>> instrucións, un script que xera a base de datos a partir dos
> > ficheiros
> > >>> TBX que se poden baixar da páxina de enriba, e outro script que
> > >>> permite realizar consultas dende unha terminal.
> > >>>
> > >>> PD: acábome de dar conta de que o código do xerador inclúe unha
> > >>> referencia a un ficheiro TBX que me pasou Marce e que metin para
> > >>> probar e de paso ter máis terminoloxía na base de datos, así que
> > pode
> > >>> que a vós non vos rule ben xa que non tedes ese ficheiro.
> > Simplemente
> > >>> eliminade a liña referente ao glosario de Marce do dicionario
> > que está
> > >>> cara o final do código do script xerador.
> > >>
> > >> Evidentemente cando teñamos rematado ese sistema de xestión de
> > >> terminoloxía o uso desta ferramenta será útil para obter as
> propostas
> > >> dos diferentes glosarios existentes ata o de agora e consideralas
> > >> durante a creación da nova terminoloxía unificada, a cal debería
> > ser a
> > >> única que se debería usar nun futuro.
> > >>
> > >> Ou sexa, este sistema é un parche temporal.
> > >
> > > Chámalle "documentar" a escolla.
> >
> > Vale.
> >
> > Envíovos unha nova versión que permite indicar as consultas como
> > exactas ou inexactas. É dicir con
> >
> > ./script --fuzzy tab
> >
> > obtéñense tódolos resultados tal como se obtiñan antes, só que é
> > bastante máis lento agora. Co exemplo este obterianse todas as
> > entradas que teñan algunha tradución en inglés que conteña tab:
> table,
> > executable, database, portable...
> >
> > Ca opción nova:
> >
> > ./script --exact tab
> >
> > só se obteñen as entradas que teñen algunha tradución en inglés que
> > conteña "tab" e "tab" non forma parte de ningunha palabra con máis
> > caracteres. Devolveria "tab order", "tab", "next tab" pero non
> > "tabulation" nin nada diso.
> >
> > Lembrade que se pode consultar por frases, con ambos modos:
> >
> > ./script --exact database manager applet
> >
> > buscaria os resultados usando a cadea "database manager applet".
> >
> > E lamento o de que o script sexa moito máis lento. Quizais se teño
> > tempo me dedicarei a ver se consigo que sexa máis rápido, pero non
> > prometo nada de nada.
> >
> > Ata logo,
> >  Leandro Regueiro
> > ___
> > G11n mailing list
> > G11n en mancomun.org 
> > http://listas.mancomun.org/mailman/listinfo/g11n
> >
> >
> >
> > 
> >
> > ___
> > G11n mailing list
> > G11n en mancomun.org
> > http://listas.mancomun.org/mailman/listinfo/g11n
>
>
> - --
> Fran Diéguez
> http://www.mabishu.com

[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Leandro Regueiro
> Leandro, moitas grazas por compartires e distribuíres eses glosarios e os
> scripts, que probarei máis tarde.

Eu só comparto e distribúo os scripts. Os glosarios non os fixen eu.

> Eu tampouco prometo nada de nada, pero fixen una pequena proba con XQuery
> para crear unha interface para interrogar directamente os documentos TBX sen
> ter que pasalos primeiro a unha base de datos SQL. Teño un formulario de
> busca de termos que permite usar expresións regulares: ao buscar un termo,
> móstrase unha lista das coincidencias e ao clicar nalgunha, móstrase a ficha
> completa correspondente, máis outro formulario para introducir comentarios
> (pendente de acabar).
>
> Teño isto no meu servidor local, en eXist, así que non volo podo mostrar de
> momento. Estiven mirando e o meu provedor de aloxamento non me permite usar
> eXist nin Tamino ou similar, parece que para iso necesito un VPS ou servidor
> dedicado ou algo así, que é un pouco caro. Da Forxa tamén me responderon
> dicindo que non contemplan instalar ningún sistema de bd XML. Alguén pode
> recomendar algunha outra maneira de montar isto?
>
> Como o vedes? Credes que sería útil? Hai tempo que quería facer isto pero
> non tiña a materia prima (os glosarios).

O que seria útil agora sería ter unha interface web para poder
consultar os glosarios. Penso que a idea de consultar directamente os
ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria
nada despois da trapallada que fixen eu co meu para devolver
resultados exactos.

En todo caso agradécese o interese e o teu traballo e agardamos que se
poida usar cedo.

Respecto á forxa, penso que tal como vai a cousa hai que considerar
evitar meter alí nada, xa que o día menos agardado nos botan todo
abaixo, pero non sen guerra pola nosa parte!!

En todo caso isto só se deberia usar como base para crear un glosario
que xunte todo o importante e resolva as inconsistencias entre os
glosarios recomendando unha opción, despois, claro está, de debatelo
entre todos nós.

Ata logo,
  Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Manuel Souto Pico
Ei,


>
> Eu só comparto e distribúo os scripts. Os glosarios non os fixen eu.
>

A min chegáronme por ti.

>
>
> O que seria útil agora sería ter unha interface web para poder
> consultar os glosarios.


Pois iso (só consultar) en principio xa o teño. Despois desde casa mando
unhas capturas para darvos unha idea.


> Penso que a idea de consultar directamente os
> ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria
> nada despois da trapallada que fixen eu co meu para devolver
> resultados exactos.
>

No meu pódese buscar con regex, ou sexa que son todo o exactos ou inexactos
que se queira.

>
> En todo caso agradécese o interese e o teu traballo e agardamos que se
> poida usar cedo.
>

Si, mellor polas mañás... ;) Nada, a ver qué sai daí.

>
> Respecto á forxa, penso que tal como vai a cousa hai que considerar
> evitar meter alí nada, xa que o día menos agardado nos botan todo
> abaixo, pero non sen guerra pola nosa parte!!
>

Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción dun
servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non
está mal, pero se puidese ser gratis era mellor ;)

>
> En todo caso isto só se deberia usar como base para crear un glosario
> que xunte todo o importante e resolva as inconsistencias entre os
> glosarios recomendando unha opción, despois, claro está, de debatelo
> entre todos nós.
>

Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda
non acabei):

Apertas,
manuel
 próxima parte 
Borrouse un adxunto en formato HTML...
URL: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091005/29befdda/attachment.htm
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Leandro Regueiro
>> Eu só comparto e distribúo os scripts. Os glosarios non os fixen eu.
>
> A min chegáronme por ti.

Xa, pero non vaiades dicindo por aí que eu fun o que lle saco a
terminoloxía dun servidor de Microsoft ou que usei fontes con
copyright sen permiso.

>> O que seria útil agora sería ter unha interface web para poder
>> consultar os glosarios.
>
> Pois iso (só consultar) en principio xa o teño. Despois desde casa mando
> unhas capturas para darvos unha idea.
>
>> Penso que a idea de consultar directamente os
>> ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria
>> nada despois da trapallada que fixen eu co meu para devolver
>> resultados exactos.
>
> No meu pódese buscar con regex, ou sexa que son todo o exactos ou inexactos
> que se queira.
>
>> En todo caso agradécese o interese e o teu traballo e agardamos que se
>> poida usar cedo.
>
> Si, mellor polas mañás... ;) Nada, a ver qué sai daí.
>
>> Respecto á forxa, penso que tal como vai a cousa hai que considerar
>> evitar meter alí nada, xa que o día menos agardado nos botan todo
>> abaixo, pero non sen guerra pola nosa parte!!
>
> Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción dun
> servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non
> está mal, pero se puidese ser gratis era mellor ;)

Xa, igual alguén ofrece espazo de balde. Xa dixera Fran que se é
software libre é máis sinxelo.

>> En todo caso isto só se deberia usar como base para crear un glosario
>> que xunte todo o importante e resolva as inconsistencias entre os
>> glosarios recomendando unha opción, despois, claro está, de debatelo
>> entre todos nós.
>
> Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda
> non acabei):

Interesante! Despois a ver como podemos usar isto no glósima para discutir.

Ata logo,
   Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Manuel Souto Pico
>
>
> >
> > Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei a opción
> dun
> > servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao mes, non
> > está mal, pero se puidese ser gratis era mellor ;)
>
> Xa, igual alguén ofrece espazo de balde. Xa dixera Fran que se é
> software libre é máis sinxelo.
>

eXist é código aberto, e XML e XQuery son estándares do W3C.

>
> >> En todo caso isto só se deberia usar como base para crear un glosario
> >> que xunte todo o importante e resolva as inconsistencias entre os
> >> glosarios recomendando unha opción, despois, claro está, de debatelo
> >> entre todos nós.
> >
> > Esa é a idea de inserir comentarios no documento TBX (é a parte que aínda
> > non acabei):
>
> Interesante! Despois a ver como podemos usar isto no glósima para discutir.
>

Que é o glósima?

Manuel
 próxima parte 
Borrouse un adxunto en formato HTML...
URL: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091005/cbf1b79d/attachment.htm
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread Antón Méixome
Manuel Souto Pico escribiu:
>
>
> >
> > Tomo nota. Calquera outra suxestión segue sendo benvinda. Mirei
> a opción dun
> > servidor dedicado en Rackspace Cloud, o máis barato sai a 10? ao
> mes, non
> > está mal, pero se puidese ser gratis era mellor ;)
>
> Xa, igual alguén ofrece espazo de balde. Xa dixera Fran que se é
> software libre é máis sinxelo.
>
>
> eXist é código aberto, e XML e XQuery son estándares do W3C.
>
>
> >> En todo caso isto só se deberia usar como base para crear un
> glosario
> >> que xunte todo o importante e resolva as inconsistencias entre os
> >> glosarios recomendando unha opción, despois, claro está, de
> debatelo
> >> entre todos nós.
> >
> > Esa é a idea de inserir comentarios no documento TBX (é a parte
> que aínda
> > non acabei):
>
> Interesante! Despois a ver como podemos usar isto no glósima para
> discutir.
>
>
> Que é o glósima?
>
> Manuel
>
> 
>
> ___
> G11n mailing list
> G11n en mancomun.org
> http://listas.mancomun.org/mailman/listinfo/g11n
>   
Podes sacar as túas propias ideas

http://www.certima.net/glosima/?1-glosima


-- 
Antón Gómez Méixome  .:lingüista:.  www.mancomun.org 
Centro de Referencia e Servizos de Software Libre 
Avda. de Vigo, s/n 15706   Santiago de Compostela  
Tel/ Fax: (0034) 981 56 98 10/ 981 59 46 16 



[G11n] Glosarios informatica en galego en formato TBX

2009-10-05 Thread marce
O Luns, 5 de Outubro de 2009 16:00:42 Manuel Souto Pico escribiu:
> Eu tampouco prometo nada de nada, pero fixen una pequena proba con XQuery

Eu estou moi interesado no xquery, para transformar do formato tbx ao 
empregado por check-rules, para implementar a funcionalidade esa de 
comprobación de consistencia do glosario.
A idea é pasar o tbx ao formato de regras empregado pola utilidade check-
rules.

Xunto un cacho dunha conversa que tiven con Kaslav ao respecto:

> {folder}i
>  id="folder"
>  hint="folder = cartafol"
>  valid msgstr="cartafol"

Algo así como (non sei como mandar ordes xquery)
for $lolailo in doc(terms.tbx)//body/termEntry
  let $tigTermsEn := $lolailo/langset[xml:lang = "en"]/tig/term
  let $ntigTermsEn := $lolailo/langset[xml:lang = "en"]/ntig/termGrp/term
for $tigTermsGl in $loalilo/langset[xml:lang = "en"]/ting/term
?  $ntigTermsGl := $lolailo/langset[xml:lang = "gl"]/ntig/termGrp/term
  return
{data($tigTermsEn), data($ntigsTermsEn)}i
 id="data($lolailo:id)"
 valid msgstr="data($tigTermsGl)"
  

>
>when running:
>
>  $ posieve check-rules -slang:gl 
>
>it will report all messages containing the substring "folder" in original
>but not the substring "cartafol" in translation (of course, -slokalize
>available for this sieve too).
>
>This far it's almost same as find-messages (except that you can write any
>number of rules and apply them in one go), but with rules you have much
>greater control of specialties and exceptions. For example, if in one
>particular catalog translation of "folder" should be something else, you can
>add another validity directive to cover it:
>
>  {folder}i
>  id="t-folder"
>  hint="folder = cartafol"
>  valid msgstr="cartafol"
>  valid cat="someapp" msgstr="something"
>
>(There are also many other validity directives which can be used to narrow
>the application of the rule.) Or, if a certain message in a certain catalog
>is crazy on its own, on that particular message you can issue a rule-
>skipping directive using the rule ID in translator comments:
>
>  {folder}i
>  id="t-folder"
>  hint="folder = cartafol"
>  valid msgstr="cartafol"
>  valid cat="someapp" msgstr="something"
>
>Yes, rules must be defined manually, but the idea is that you have complete
>silence when running terminology check on a catalog, if that catalog has all
>terminology good. And if there is a false positive, then that you can
>silence it, on proper level, such that you recover the silence.
>
>Also, intent behind check-rules is to perform all possible checks in one
>go, not only terminology, such that you don't have to run 10 different
>checkers one by one. E.g. if there is an Aspell spelling dictionary for
>Galician, you can add a rule for checking spelling:
>
>  *hook name="check-lingo/check-spell-sp" factory="lang='gl'" on="msgstr"
>  id="x-spell"
>  hint="unknown or misspelled word"
>
>And so on.


[G11n] Glosarios informatica en galego en formato TBX

2009-10-06 Thread Leandro Regueiro
>> O que seria útil agora sería ter unha interface web para poder
>> consultar os glosarios. Penso que a idea de consultar directamente os
>> ficheiros TBX pode ralentizar un pouco a cousa, pero non aseguraria
>> nada despois da trapallada que fixen eu co meu para devolver
>> resultados exactos.
>
> Home, non creo que haxa moita diferenza na prática entre o tempo de execución
> dunha consulta SQL e unha Xquery (sobre un ficheiro duns 5 MiB e a súa BBDD
> equivalente)

Non vou entrar ao trapo.

Moi interesante o de usar o TBX para comprobar que a palabra si se
traduce como recomenda o glosario. Seguro que nun futuro o imos usar a
cotío se conseguimos montar unha infrastrutura que simplifique isto ao
máximo.

Ata logo,
  Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-10-06 Thread Leandro Regueiro
Engado unha terceira e última versión (agora si que non o toco máis)
cun código que se executa máis rápido.

Ata logo,
 Leandro Regueiro
 próxima parte 
Borrouse unha mensaxe que non está en formato texto plano...
Nome : scripts_para_crear_e_consultar_bd_glosarios_versión3.tar.gz
Tipo   : application/x-gzip
Tamaño : 6222 bytes
Descrición: non dispoñible
Url: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091006/5dc61f80/attachment-0001.bin
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-06 Thread Méixome
Grazas Leandro, xa che comentarei como me vai.

Non estaría de máis que os meteses na Forxa tamén.


Leandro Regueiro escribiu:
> Engado unha terceira e última versión (agora si que non o toco máis)
> cun código que se executa máis rápido.
>
> Ata logo,
>  Leandro Regueiro
>   
> 
>
> ___
> G11n mailing list
> G11n en mancomun.org
> http://listas.mancomun.org/mailman/listinfo/g11n
>   



[G11n] Glosarios informatica en galego en formato TBX

2009-10-06 Thread Leandro Regueiro
> Grazas Leandro, xa che comentarei como me vai.
>
> Non estaría de máis que os meteses na Forxa tamén.

Se total desaparece nun tris.

Ata logo,
  Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-10-30 Thread Leandro Regueiro
Ola,
acabo de ver hai un anaco que actualizaron o arquivo que hai en
http://ghicho.iespana.es/ incluíndo máis ficheiros e para tocar as
narices cambiándolle os nomes.

Aínda así en dez minutiños arranxei o script de creación da base de
datos que xa tiña e xa está rulando outra vez, agora con máis datos. O
script de consulta non cambiou nada, e segue as mesmas instruccións
que xa puxen noutra mensaxe anterior e que vou copiar aquí embaixo
para non vos marear:

> Envíovos unha nova versión que permite indicar as consultas como
> exactas ou inexactas. É dicir con
>
> ./script --fuzzy tab
>
> obtéñense tódolos resultados tal como se obtiñan antes, só que é
> bastante máis lento agora. Co exemplo este obterianse todas as
> entradas que teñan algunha tradución en inglés que conteña tab: table,
> executable, database, portable...
>
> Ca opción nova:
>
> ./script --exact tab
>
> só se obteñen as entradas que teñen algunha tradución en inglés que
> conteña "tab" e "tab" non forma parte de ningunha palabra con máis
> caracteres. Devolveria "tab order", "tab", "next tab" pero non
> "tabulation" nin nada diso.
>
> Lembrade que se pode consultar por frases, con ambos modos:
>
> ./script --exact database manager applet
>
> buscaria os resultados usando a cadea "database manager applet".


Ata logo,
 Leandro Regueiro
 próxima parte 
Borrouse unha mensaxe que non está en formato texto plano...
Nome : scripts_para_crear_e_consultar_bd_glosarios_version4.tar.gz
Tipo   : application/x-gzip
Tamaño : 5225 bytes
Descrición: non dispoñible
Url: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091030/b1f9d7a5/attachment-0001.bin
 


[G11n] Glosarios informatica en galego en formato TBX

2009-10-30 Thread Leandro Regueiro
2009/10/30 Leandro Regueiro :
> Ola,
> acabo de ver hai un anaco que actualizaron o arquivo que hai en
> http://ghicho.iespana.es/ incluíndo máis ficheiros e para tocar as
> narices cambiándolle os nomes.
>
> Aínda así en dez minutiños arranxei o script de creación da base de
> datos que xa tiña e xa está rulando outra vez, agora con máis datos. O
> script de consulta non cambiou nada, e segue as mesmas instruccións
> que xa puxen noutra mensaxe anterior e que vou copiar aquí embaixo
> para non vos marear:
>
>> Envíovos unha nova versión que permite indicar as consultas como
>> exactas ou inexactas. É dicir con
>>
>> ./script --fuzzy tab
>>
>> obtéñense tódolos resultados tal como se obtiñan antes, só que é
>> bastante máis lento agora. Co exemplo este obterianse todas as
>> entradas que teñan algunha tradución en inglés que conteña tab: table,
>> executable, database, portable...
>>
>> Ca opción nova:
>>
>> ./script --exact tab
>>
>> só se obteñen as entradas que teñen algunha tradución en inglés que
>> conteña "tab" e "tab" non forma parte de ningunha palabra con máis
>> caracteres. Devolveria "tab order", "tab", "next tab" pero non
>> "tabulation" nin nada diso.
>>
>> Lembrade que se pode consultar por frases, con ambos modos:
>>
>> ./script --exact database manager applet
>>
>> buscaria os resultados usando a cadea "database manager applet".

Importante, non me lembrei de borrar a liña esa que puxen para incluír
unha copia do glosario de Marce, e que sobra do ficheiro de creación
da base de datos a non ser que consigades o ficheiro dende
http://websvn.kde.org/*checkout*/trunk/l10n-kde4/gl/terms.tbx e lle
cambiedes o nome polo nome que está no código do script en Python.
Outra opción é directamente eliminar a liña conflitiva, pero igual a
Marce non lle gusta :)

Ata logo,
  Leandro Regueiro


[G11n] Glosarios informatica en galego en formato TBX

2009-11-25 Thread Leandro Regueiro
>> Ola,
>> acabo de ver hai un anaco que actualizaron o arquivo que hai en
>> http://ghicho.iespana.es/ incluíndo máis ficheiros e para tocar as
>> narices cambiándolle os nomes.
>>
>> Aínda así en dez minutiños arranxei o script de creación da base de
>> datos que xa tiña e xa está rulando outra vez, agora con máis datos. O
>> script de consulta non cambiou nada, e segue as mesmas instruccións
>> que xa puxen noutra mensaxe anterior e que vou copiar aquí embaixo
>> para non vos marear:
>>
>>> Envíovos unha nova versión que permite indicar as consultas como
>>> exactas ou inexactas. É dicir con
>>>
>>> ./script --fuzzy tab
>>>
>>> obtéñense tódolos resultados tal como se obtiñan antes, só que é
>>> bastante máis lento agora. Co exemplo este obterianse todas as
>>> entradas que teñan algunha tradución en inglés que conteña tab: table,
>>> executable, database, portable...
>>>
>>> Ca opción nova:
>>>
>>> ./script --exact tab
>>>
>>> só se obteñen as entradas que teñen algunha tradución en inglés que
>>> conteña "tab" e "tab" non forma parte de ningunha palabra con máis
>>> caracteres. Devolveria "tab order", "tab", "next tab" pero non
>>> "tabulation" nin nada diso.
>>>
>>> Lembrade que se pode consultar por frases, con ambos modos:
>>>
>>> ./script --exact database manager applet
>>>
>>> buscaria os resultados usando a cadea "database manager applet".
>
> Importante, non me lembrei de borrar a liña esa que puxen para incluír
> unha copia do glosario de Marce, e que sobra do ficheiro de creación
> da base de datos a non ser que consigades o ficheiro dende
> http://websvn.kde.org/*checkout*/trunk/l10n-kde4/gl/terms.tbx e lle
> cambiedes o nome polo nome que está no código do script en Python.
> Outra opción é directamente eliminar a liña conflitiva, pero igual a
> Marce non lle gusta :)

Ola de novo.
Envío a última versión dos scripts para poder xerar a base de datos
incluíndo o TBX da wiki de Mancomún e o do glosario de openSuse. Vai
no anexo.
 próxima parte 
Borrouse unha mensaxe que non está en formato texto plano...
Nome : scripts_para_crear_e_consultar_bd_glosarios_version5.tar.gz
Tipo   : application/x-gzip
Tamaño : 5284 bytes
Descrición: non dispoñible
Url: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091125/992f1c6a/attachment.bin
 


[G11n] Glosarios informatica en galego en formato TBX

2009-12-04 Thread Leandro Regueiro
2009/11/25 Leandro Regueiro :
>>> Ola,
>>> acabo de ver hai un anaco que actualizaron o arquivo que hai en
>>> http://ghicho.iespana.es/ incluíndo máis ficheiros e para tocar as
>>> narices cambiándolle os nomes.
>>>
>>> Aínda así en dez minutiños arranxei o script de creación da base de
>>> datos que xa tiña e xa está rulando outra vez, agora con máis datos. O
>>> script de consulta non cambiou nada, e segue as mesmas instruccións
>>> que xa puxen noutra mensaxe anterior e que vou copiar aquí embaixo
>>> para non vos marear:
>>>
 Envíovos unha nova versión que permite indicar as consultas como
 exactas ou inexactas. É dicir con

 ./script --fuzzy tab

 obtéñense tódolos resultados tal como se obtiñan antes, só que é
 bastante máis lento agora. Co exemplo este obterianse todas as
 entradas que teñan algunha tradución en inglés que conteña tab: table,
 executable, database, portable...

 Ca opción nova:

 ./script --exact tab

 só se obteñen as entradas que teñen algunha tradución en inglés que
 conteña "tab" e "tab" non forma parte de ningunha palabra con máis
 caracteres. Devolveria "tab order", "tab", "next tab" pero non
 "tabulation" nin nada diso.

 Lembrade que se pode consultar por frases, con ambos modos:

 ./script --exact database manager applet

 buscaria os resultados usando a cadea "database manager applet".
>>
>> Importante, non me lembrei de borrar a liña esa que puxen para incluír
>> unha copia do glosario de Marce, e que sobra do ficheiro de creación
>> da base de datos a non ser que consigades o ficheiro dende
>> http://websvn.kde.org/*checkout*/trunk/l10n-kde4/gl/terms.tbx e lle
>> cambiedes o nome polo nome que está no código do script en Python.
>> Outra opción é directamente eliminar a liña conflitiva, pero igual a
>> Marce non lle gusta :)
>
> Ola de novo.
> Envío a última versión dos scripts para poder xerar a base de datos
> incluíndo o TBX da wiki de Mancomún e o do glosario de openSuse. Vai
> no anexo.

Inclúo novas versións dos dous scripts para poder importar TBX que
usen a etiqueta para abreviaturas e para que inclúa os dous últimos
TBX: os dos borradores de guías de estilo da OSLUDC e de Xusto A.
Rodríguez Río e Xosé A. Rubal López.
 próxima parte 
Borrouse unha mensaxe que non está en formato texto plano...
Nome : scripts_para_crear_e_consultar_bd_glosarios_version6.tar.gz
Tipo   : application/x-gzip
Tamaño : 5380 bytes
Descrición: non dispoñible
Url: 
http://listas.mancomun.org/pipermail/g11n/attachments/20091204/6280919e/attachment.bin