Re: [Semi-OT] Axuda cunha expresión regular
O Sábado 04 Outubro 2008 15:49, Jesus Bravo Alvarez escribiu: > E > confiar en que non haxa ningunha etiqueta partida en dúas liñas ;) Quedou coma o plano! Recén entregados en trunk/l10n-support/gl/tools están os scripts cos que estaba a argallar. O que fan é pór o msgid/msgstr nunha liña cada un, e adicionalmente retiran as etiquetas, entidades, atallos e troca as conxuncións et por and. Que para que é útil... pois agora non o recordo exactamente, pero téñoos empregado. -- Best regards, MV
Re: [Semi-OT] Axuda cunha expresión regular
> >Isto é o que emprega lokalize para dar coas etiquetas xml: > >(<[^>]+>)+|(&[A-Za-z_:][A-Za-z0-9_\\.:-]*;)+ > > >E isto atopa calquera etiqueta XML ou secuencias de escape tipo [...] >$line =~ s/REGEXP//g; E como sería a regexp? O citado en riba para lokalize? > > E confiar en que non haxa ningunha etiqueta partida en dúas liñas ;) Je,je, iso xa o teño arranchado: é o de eliminar as etiquetas e demáis músicas é o que me falla nun script adaptado do port2gal, que o que fai é tomar un po, e ou pór cada msgid nunh liña, ou idem para o msgstr. Que para que o quero? Pois para deixalo en trunk/l10n-support/gl/tools, ao dispór de quen lle sexa útil (pontualmente, para as listaxes de estrelas e demáis, a min fóronmo) Que vaia ben
Re: [Semi-OT] Axuda cunha expresión regular
O Sábado 04 de Outubro de 2008 ás 10:11, mvillarino dicía: >Isto é o que emprega kbabel para dar coas etiquetas xml: ><[A-Za-z0-9n]+[^>]*/?> Curiosa cadea, é exactamente así? Isto só atopa secuencias de dúas etiquetas, unha de peche e outra de abertura (ou con peche incorporado), tipo: >Isto é o que emprega lokalize para dar coas etiquetas xml: >(<[^>]+>)+|(&[A-Za-z_:][A-Za-z0-9_\\.:-]*;)+ E isto atopa calquera etiqueta XML ou secuencias de escape tipo >Poderíame alguén indicar a tradución destas a Perl, para empregalas nun script >que fai tal que isto: >while ($line =~ REGEXP) { > s/REGEXP//g; >} Isto podes resumilo en: $line =~ s/REGEXP//g; Se non atopa a expresión na liña, non lle fai nada. E sobre como traducilo... non ten nada que traducir ;) Perl acepta directamente expresións regulares estendidas. Terás que pór \/ en vez de /, e podes esquecer o n porque supoño que estás a ler liña a liña. E confiar en que non haxa ningunha etiqueta partida en dúas liñas ;) -- Unha aperta, Jesús Bravo Álvarez
Re: [Semi-OT] Axuda cunha expresión regular
O Sábado 04 Outubro 2008 09:03, Salvador Fandino escribiu: > Para facer iso tes o modulo HTML::Strip (que vale para HTML e XML) no CPAN. > Usar expresións regulares para procesar XML, en xeral, e unha moi mala > idea. E polib para manexar ficheiros po con python, pero non podo asumir que a máquina onde o vaia executar teña iso instalado. debo correr o risco de quitar de máis ou de menos. Aliás, non teño tempo de aprender a empregar bibliotecas en perl, nen gañas!. -- Best regards, MV
Re: [Semi-OT] Axuda cunha expresión regular
- Original Message > From: mvillarino > To: proxecto@trasno.net > Sent: Saturday, October 4, 2008 10:11:43 AM > Subject: [Semi-OT] Axuda cunha expresión regular > > Isto é o que emprega kbabel para dar coas etiquetas xml: > <[A-Za-z0-9n]+[^>]*/?> > > Isto é o que emprega lokalize para dar coas etiquetas xml: > (<[^>]+>)+|(&[A-Za-z_:][A-Za-z0-9_\\.:-]*;)+ > > Poderíame alguén indicar a tradución destas a Perl, para empregalas nun > script > que fai tal que isto: > while ($line =~ REGEXP) { > s/REGEXP//g; > } > > uséase, para suprimir as etiquetas (e mesmo entidades) xml de textos. Para facer iso tes o modulo HTML::Strip (que vale para HTML e XML) no CPAN. Usar expresións regulares para procesar XML, en xeral, e unha moi mala idea. - Salva
[Semi-OT] Axuda cunha expresión regular
Isto é o que emprega kbabel para dar coas etiquetas xml: <[A-Za-z0-9n]+[^>]*/?> Isto é o que emprega lokalize para dar coas etiquetas xml: (<[^>]+>)+|(&[A-Za-z_:][A-Za-z0-9_\\.:-]*;)+ Poderíame alguén indicar a tradución destas a Perl, para empregalas nun script que fai tal que isto: while ($line =~ REGEXP) { s/REGEXP//g; } uséase, para suprimir as etiquetas (e mesmo entidades) xml de textos. -- Best regards, MV