Re: [OT] Limpiar texto.

2009-01-21 Por tema N0K

N0K escribió:

Buenas.

¿ Conoceis alguna forma de limpiar un texto de caracteres que no sean 
números o letras ?


Es decir dado el texto hola 'como' estas: manolo - ignacio
Quedara el texto: hola como estas manolo ignacio

Yo lo estoy intentando hacer con awk y gsub, pero tengo que indicar 
caracter a caracter.

¿ Alguna idea ?

Ya lo hice con:
awk '{gsub(/[^a-z]/,); print}'

Thanks.

--
Experiencias de un sysadmin en Debian.
http://www.cdbarra.com/


--
To UNSUBSCRIBE, email to debian-user-spanish-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Re: [OT] Limpiar texto.

2009-01-21 Por tema Pedro Insua
On Wed, Jan 21, 2009 at 10:13:03AM +0100, N0K wrote:
 N0K escribió:
 Buenas.

 ¿ Conoceis alguna forma de limpiar un texto de caracteres que no sean  
 números o letras ?

 Es decir dado el texto hola 'como' estas: manolo - ignacio
 Quedara el texto: hola como estas manolo ignacio

 Yo lo estoy intentando hacer con awk y gsub, pero tengo que indicar  
 caracter a caracter.
 ¿ Alguna idea ?
 Ya lo hice con:
 awk '{gsub(/[^a-z]/,); print}'

  
  S�, asi elimina todo aquello que no est� entre a-zA-Z, pero en ello
tambi�n van los, por ejemplo, espacios. Es decir, la salida ser�a algo
como holacomoestasmanoloignacio

  Para que eso no ocurra, debe ponerle un espacio en REGEXP, [^a-z ]

  Tambi�n puede utilizar 'sed', que har� lo mismo: 

  sed 's/[^a-z A-Z]//g' fichero

-- 
Porqu� loitar e matar, se podes amar e sonhar

/\
\ /  CAMPANHA DA FITA ASCII - CONTRA MAIL HTML
 X   ASCII RIBBON CAMPAIGN - AGAINST HTML MAIL
/ \


-- 
To UNSUBSCRIBE, email to debian-user-spanish-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Re: [OT] Limpiar texto.

2009-01-21 Por tema N0K



Ya lo hice con:
awk '{gsub(/[^a-z]/,); print}'


  
  S�, asi elimina todo aquello que no est� entre a-zA-Z, pero en ello

tambi�n van los, por ejemplo, espacios. Es decir, la salida ser�a algo
como holacomoestasmanoloignacio

  Para que eso no ocurra, debe ponerle un espacio en REGEXP, [^a-z ]

  Tambi�n puede utilizar 'sed', que har� lo mismo: 


  sed 's/[^a-z A-Z]//g' fichero

  

Gracias Pedro, pero también quería quitar los espacios.


--
To UNSUBSCRIBE, email to debian-user-spanish-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Re: [OT] Limpiar texto.

2009-01-21 Por tema Pablo Jiménez
On Wed, Jan 21, 2009 at 10:35:41AM +0100, N0K wrote:

 Ya lo hice con:
 awk '{gsub(/[^a-z]/,); print}'

 
 S�, asi elimina todo aquello que no est� entre a-zA-Z, pero en ello
 tambi�n van los, por ejemplo, espacios. Es decir, la salida ser�a algo
 como holacomoestasmanoloignacio

   Para que eso no ocurra, debe ponerle un espacio en REGEXP, [^a-z ]

   Tambi�n puede utilizar 'sed', que har� lo mismo: 

   sed 's/[^a-z A-Z]//g' fichero

   
 Gracias Pedro, pero también quería quitar los espacios.

Si quitas los espacios, no obtendrás lo que pides:

$ cat mensaje.txt
hola 'como' estas: manolo - ignacio
$ sed 's/[^a-zA-Z0-9]//g'  mensaje.txt
holacomoestasmanoloignacio
$ sed 's/[^a-zA-Z0-9 ]//g'  mensaje.txt
hola como estas manolo  ignacio

Saludos.

-- 
Pablo Jiménez


--
To UNSUBSCRIBE, email to debian-user-spanish-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org