Re: [Python] Estrarre stringa da stringa

Marco Beri Wed, 29 Sep 2010 06:49:12 -0700

2010/9/29 franco93it <[email protected]>

> Salve.
> Scarico il sorgente di una pagina web in questo modo:
>
> import urllib
> sock = urllib.urlopen("http://www.sito.ext/pagina.ext";)
> sorgente = sock.read()
> sock.close()
>
>
import re
r = re.compile('(<!--.*?-->)|(<[^>]*>)|([^<]+)', re.DOTALL)
for x, y, z in r.findall(sorgente):
     if z.strip():
       print z.replace("&nbsp;", " ")


Ciao.
Marco.

-- 
http://thinkcode.tv/gratis - Capire in 15 minuti cosa può fare Python
http://stacktrace.it - Aperiodico di resistenza informatica
http://python.thinkcode.tv - Videocorso di Python
http://beri.it - Blog di una testina di vitello

_______________________________________________
Python mailing list
[email protected]
http://lists.python.it/mailman/listinfo/python

Re: [Python] Estrarre stringa da stringa

Rispondere a