Te recomiendo no parsear XML/XHTML mediante regex, no es una buena idea ;-)
Un cordial saludo: -- Nekmo. Sitio web: http://nekmo.com Dirección de contacto: conta...@nekmo.com XMPP/Jabber: conta...@nekmo.com Identi.ca: http://identi.ca/nekmo Diaspora: Nekmo El día 26 de abril de 2011 13:04, Francisco Rivas <franciscojriv...@gmail.com> escribió: > Hola a todos, perdonen la tardanza he estado fuera estos dias. Feliz > Pascua!. > Pues gracias a los comentarios hare pruebas con varias de ellas, pero estoy > viendo que por ejemplo una expresion regular tambien puede ser muy util sin > usar ningun modulo adicional. > > lxml esta muy bien. :D > > Muy buen dia. > > 2011/4/21 lasizoillo <lasizoi...@gmail.com> >> >> El día 21 de abril de 2011 15:16, lopz <lowlife...@gmail.com> escribió: >> > >> > El día 20 de abril de 2011 09:37, lasizoillo <lasizoi...@gmail.com> >> > escribió: >> >> >> >> Recuerdo que cuando usaba BeautifulSoup, antes de por supuesto pasarme >> >> a otra librería, tenía la extraña costumbre de leer la documentación: >> >> >> >> http://www.crummy.com/software/BeautifulSoup/documentation.html#Modifying%20the%20Parse%20Tree >> > >> > >> > Solo por curiosidad ¿cuál usas ahora? >> > Es que yo me he quedado con BS y al parecer el lxml va bastante fino. >> > >> >> Pues si, uso lxml mayormente. Pero no hay que olvidarse de BS del todo ;-) >> http://lxml.de/elementsoup.html >> >> Tener xpath y selectores css puede ahorrar mucho tiempo (de >> programador) y lineas de código. Con el iterparse puedes procesar >> ficheros xml de varios gigas a una velocidad equivalente o superior a >> la que se puede conseguir con un parser sax en java (mucho más coñazo >> de hacer y mantener). >> >> Tanto para webscraping, como para procesar ficheros enormes en xml, >> lxml no defrauda. La unica desventaja es que hay que compilar cosas en >> c, no es pure python. >> >> Saludos: >> >> Javi >> _______________________________________________ >> Python-es mailing list >> Python-es@python.org >> http://mail.python.org/mailman/listinfo/python-es >> FAQ: http://python-es-faq.wikidot.com/ > > > _______________________________________________ > Python-es mailing list > Python-es@python.org > http://mail.python.org/mailman/listinfo/python-es > FAQ: http://python-es-faq.wikidot.com/ > > _______________________________________________ Python-es mailing list Python-es@python.org http://mail.python.org/mailman/listinfo/python-es FAQ: http://python-es-faq.wikidot.com/