O lynx com a opção -dump não poderia te ajudar nisso?


Em 2 de agosto de 2010 19:07, Helton Moraes <heltonbi...@gmail.com>escreveu:

>
>
> Caros Colegas
>
> Estou precisando pescar uma grande quantidade de dados de sites de lista
> telefônica. Cada pesquisa (por especialidades médicas) retorna várias
> páginas, então pretendo automatizar essa pesca.
>
> O fato é que, se eu dou um "selecionar tudo" no Firefox, e copio/colo no
> editor de texto, obtenho algo do tipo:
>
> Ardais Clínica de Cirurgia Plástica Tel: (51) 3330-4856
> Rua Quintino Bocaiúva, 699
> Floresta - Porto Alegre - RS - CEP: 90440-051
> mapa | +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> Arnt, Ricardo A Tel: (51) 3346-5762
> Rua Mariante, 288 s 1007
> Rio Branco - Porto Alegre - RS - CEP: 90430-181
> mapa | +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> Augusto Casagrande Tel: (51) 3346-2812
> Rua Mariante, 288 s 501
> Rio Branco - Porto Alegre - RS - CEP: 90430-180
> mapa | +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> Azambuja, Paulo R F Tel: (51) 3328-9081
> Rua Des Espiridião L Medeiros, 81
> Três Figueiras - Porto Alegre - RS - CEP: 91330-020
> +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> .
> .
> .
> .
>
> mas se uso o wget, evidentemente essa formatação se perde, e os
> códigos-fonte html neste caso não têm uma estrutura boa para usar algum
> parsing.
>
> Assim, a pergunta é:
> "De que forma, ou qual programa/comando/opção eu poderia usar, via linha de
> comando, para capturar para um .txt o conteúdo da página conforme mostrado
> no navegador (o que seria equivalente a copiar e colar com o mouse)?"
>
> Desde já agradeço a atenção
>
> Helton
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>  
>



-- 
Elder Marco

GNU/Linux User: #471180

"Contra o positivismo, que pára perante os fenômenos e diz: 'Há apenas
fatos', eu digo: 'Ao contrário, fatos é o que não há; há apenas
interpretações'. "(Nietzsche)


[As partes desta mensagem que não continham texto foram removidas]



------------------------------------

---------------------------------------------------------------------
Esta lista não admite a abordagem de outras liguagens de programação, como 
perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio 
aviso.
---------------------------------------------------------------------
Sair da lista: shell-script-unsubscr...@yahoogrupos.com.br
---------------------------------------------------------------------
Esta lista é moderada de acordo com o previsto em 
http://www.listas-discussao.cjb.net
---------------------------------------------------------------------
Servidor Newsgroup da lista: news.gmane.org
Grupo: gmane.org.user-groups.programming.shell.brazil

Links do Yahoo! Grupos

<*> Para visitar o site do seu grupo na web, acesse:
    http://br.groups.yahoo.com/group/shell-script/

<*> Para sair deste grupo, envie um e-mail para:
    shell-script-unsubscr...@yahoogrupos.com.br

<*> O uso que você faz do Yahoo! Grupos está sujeito aos:
    http://br.yahoo.com/info/utos.html


Responder a