estou cansado pra implementar, mas o Web::Scraper é tipo um néctar dos deuses, vc faz um crawler em 5' com ele, bem estilo Perl(que sai da frente e deixa você focar na solução) isso se o HTML não for um monstrengo =)
[]s, Marcio Ferreira @_marcioferreira (11) 8567-1482 skype: marcio.ferreir4 marciodesouzaferreira.blogspot.com 2012/10/19 Rafael Prenzier <rafaelprenz...@gmail.com> > WWW::Mechanize ++ > > > 2012/10/19 Ricardo Filipo <ricardo_fil...@yahoo.com.br> > >> Eu gosto do HTML::TreeBuilder pois dá uma visão mais organizada do DOM. >> >> Veja um exemplo de uso: >> >> https://github.com/rfilipo/WebService-EBC/blob/master/lib/WebService/EBC/News.pm >> >> ------------------------------ >> *De:* Aureliano Guedes <guedes_1...@hotmail.com> >> *Para:* Rio PM <rio-pm@pm.org> >> *Enviadas:* Sexta-feira, 19 de Outubro de 2012 13:22 >> *Assunto:* [Rio-pm] HTML::Parse >> >> Ola monges, >> tudo bem? >> >> Qual um bom modulo para buscar string em um HTML? >> Vocês aconselham o HTML::Parse? >> >> Eu não entendo muito de html, mas estou tentando pegar um link dentro de >> uma pagina. >> >> Um exemplo é esse: >> http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/ >> >> Os Links estão nesse formato: >> >> <a href="/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html" >> title="Thaeme E Thiago - Ai Que Do"> >> >> >> O Problema é que no caso dessa pagina tem 4 links desse modelo e eu >> queria pegar apenas o primeiro. >> Poderia usar regexp mas anteriormente me disseram que não é muito >> elegante parsear HTML na unha. >> >> Sei que a duvida é banal, mas se puderem me dar uma dica agradeço. >> >> Att, >> Aureliano Guedes. >> >> _______________________________________________ >> Rio-pm mailing list >> Rio-pm@pm.org >> http://mail.pm.org/mailman/listinfo/rio-pm >> >> >> _______________________________________________ >> Rio-pm mailing list >> Rio-pm@pm.org >> http://mail.pm.org/mailman/listinfo/rio-pm >> > > > > -- > Rafael Prenzier dos Santos | Engenheiro e Perl Monger > > (11) 5209-0847 > > www.prenzier.com > > <http://gplus.to/prenzier> <http://www.facebook.com/rafaelprenzier> > <http://twitter.com/prenzier/> > <http://www.orkut.com.br/Main#Profile?uid=13496291347057199080> > <http://cid-eacb613d80ce8dba.profile.live.com/> > <http://www.delicious.com/rafaelprenzier/> > <http://www.google.com/profiles/rafaelprenzier> > <http://br.linkedin.com/pub/rafael-prenzier-dos-santos/29/6a2/478> > <http://www.youtube.com/prenzier> > <http://www.diigo.com/user/prenzier> > <http://www.shelfari.com/rprenzier/shelf> > <http://flavors.me/prenzier> > <http://www.diigo.com/user/prenzier> > > > > _______________________________________________ > Rio-pm mailing list > Rio-pm@pm.org > http://mail.pm.org/mailman/listinfo/rio-pm >
_______________________________________________ Rio-pm mailing list Rio-pm@pm.org http://mail.pm.org/mailman/listinfo/rio-pm