Re: [Rio-pm] HTML::Parse

Aureliano Guedes Fri, 19 Oct 2012 10:57:15 -0700

Isso, é mais ou menos isso mesmo.
No caso você usou o WWW:Mechanize, que apesar de eu usar como navegador nunca 
tinha parado para ver essa propriedade dele.
Mas será que não fica um pouco pesado não usar o Mechanize?

Eu não entendi como usar o Web::Scraper indicado pelo Junior.

Mas ja me ajudaram, obrigado.

Date: Fri, 19 Oct 2012 14:47:38 -0300
From: andregarciacarne...@gmail.com
To: rio-pm@pm.org
Subject: Re: [Rio-pm] HTML::Parse

Vários módulos e vários jeitos de fazer!

Se eu entendi o que você precisa, pode ser assim:
use common::sense;use WWW::Mechanize;
my $m = WWW::Mechanize->new();$m->get('http://www.google.com');my @Links = 
$m->links();foreach my $link(@Links){

    say $link->text;    }undef $m;

#Por favor, RTFM aqui: 
http://search.cpan.org/~jesse/WWW-Mechanize-1.72/lib/WWW/Mechanize/Link.pm 

Caso não seja isso o que você quer, explique melhor por gentileza!

2012/10/19 Aureliano Guedes <guedes_1...@hotmail.com>

Ola monges,
tudo bem?

Qual um bom modulo para buscar string em um HTML?
Vocês aconselham o HTML::Parse?

Eu não entendo muito de html, mas estou tentando pegar um link dentro de uma 
pagina.

Um exemplo é esse: http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/

Os Links estão nesse formato: 
<a href="/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html" 
title="Thaeme E Thiago - Ai Que Do">

O Problema é que no caso dessa pagina tem 4 links desse modelo e eu queria 
pegar apenas o primeiro.
Poderia usar regexp mas anteriormente me disseram que não é muito elegante 
parsear HTML na unha.

Sei que a duvida é banal, mas se puderem me dar uma dica agradeço.

Att,
Aureliano Guedes.

_______________________________________________

Rio-pm mailing list

Rio-pm@pm.org

http://mail.pm.org/mailman/listinfo/rio-pm

-- 
André Garcia Carneiro
Software Engineer

(11)982907780

_______________________________________________
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm

_______________________________________________
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm

Re: [Rio-pm] HTML::Parse

Reply via email to