2010/9/29 franco93it <franco9...@gmail.com> > Salve. > Scarico il sorgente di una pagina web in questo modo: > > import urllib > sock = urllib.urlopen("http://www.sito.ext/pagina.ext") > sorgente = sock.read() > sock.close() > > import re r = re.compile('(<!--.*?-->)|(<[^>]*>)|([^<]+)', re.DOTALL) for x, y, z in r.findall(sorgente): if z.strip(): print z.replace(" ", " ")
Ciao. Marco. -- http://thinkcode.tv/gratis - Capire in 15 minuti cosa può fare Python http://stacktrace.it - Aperiodico di resistenza informatica http://python.thinkcode.tv - Videocorso di Python http://beri.it - Blog di una testina di vitello
_______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python