2012/4/23 Lorenzo Macchiavelli <lmacchiave...@gmail.com>

> Ciao a tutti,
>
> sto cercando di realizzare un piccolo script che apre tutti i file del cms
> (centinaia, lavoro devastante )
> che uso in azienda e pulisce gli spazi tra i tag, tabulazioni ,ritorni a
> capo e commenti!
> tutto funzionante!... tranne la cosa essenziale!!... l'espressione
> regolare che elimina gli spazi :) !
> premettendo che sono pochi giorni che ho iniziato ad utilizzarle!
>
> result = re.sub(r"(?m)(>\n+|\t|\r|\s+\?<)|(<!--.*?-->)", "", text)
>
> praticamente  con questa sovrascrivo anche i simboli(< >), come faccio a
> ad evitare che prenda anche il primo carattere del gruppo di ricerca?..
>

io userei beautifulsoup e cancellerei cosi i commenti
http://stackoverflow.com/questions/3507283/how-can-i-strip-comment-tags-from-html-using-beautifulsoup

le espressioni regolari fanno a cazzotti con html
S
_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Rispondere a