O lynx com a opção -dump não poderia te ajudar nisso?
Em 2 de agosto de 2010 19:07, Helton Moraes <heltonbi...@gmail.com>escreveu: > > > Caros Colegas > > Estou precisando pescar uma grande quantidade de dados de sites de lista > telefônica. Cada pesquisa (por especialidades médicas) retorna várias > páginas, então pretendo automatizar essa pesca. > > O fato é que, se eu dou um "selecionar tudo" no Firefox, e copio/colo no > editor de texto, obtenho algo do tipo: > > Ardais Clínica de Cirurgia Plástica Tel: (51) 3330-4856 > Rua Quintino Bocaiúva, 699 > Floresta - Porto Alegre - RS - CEP: 90440-051 > mapa | +info | torpedo > Compartilhe essa informação no Facebook Compartilhe essa informação no > Twitter > > Arnt, Ricardo A Tel: (51) 3346-5762 > Rua Mariante, 288 s 1007 > Rio Branco - Porto Alegre - RS - CEP: 90430-181 > mapa | +info | torpedo > Compartilhe essa informação no Facebook Compartilhe essa informação no > Twitter > > Augusto Casagrande Tel: (51) 3346-2812 > Rua Mariante, 288 s 501 > Rio Branco - Porto Alegre - RS - CEP: 90430-180 > mapa | +info | torpedo > Compartilhe essa informação no Facebook Compartilhe essa informação no > Twitter > > Azambuja, Paulo R F Tel: (51) 3328-9081 > Rua Des Espiridião L Medeiros, 81 > Três Figueiras - Porto Alegre - RS - CEP: 91330-020 > +info | torpedo > Compartilhe essa informação no Facebook Compartilhe essa informação no > Twitter > > . > . > . > . > > mas se uso o wget, evidentemente essa formatação se perde, e os > códigos-fonte html neste caso não têm uma estrutura boa para usar algum > parsing. > > Assim, a pergunta é: > "De que forma, ou qual programa/comando/opção eu poderia usar, via linha de > comando, para capturar para um .txt o conteúdo da página conforme mostrado > no navegador (o que seria equivalente a copiar e colar com o mouse)?" > > Desde já agradeço a atenção > > Helton > > [As partes desta mensagem que não continham texto foram removidas] > > > -- Elder Marco GNU/Linux User: #471180 "Contra o positivismo, que pára perante os fenômenos e diz: 'Há apenas fatos', eu digo: 'Ao contrário, fatos é o que não há; há apenas interpretações'. "(Nietzsche) [As partes desta mensagem que não continham texto foram removidas] ------------------------------------ --------------------------------------------------------------------- Esta lista não admite a abordagem de outras liguagens de programação, como perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio aviso. --------------------------------------------------------------------- Sair da lista: shell-script-unsubscr...@yahoogrupos.com.br --------------------------------------------------------------------- Esta lista é moderada de acordo com o previsto em http://www.listas-discussao.cjb.net --------------------------------------------------------------------- Servidor Newsgroup da lista: news.gmane.org Grupo: gmane.org.user-groups.programming.shell.brazil Links do Yahoo! Grupos <*> Para visitar o site do seu grupo na web, acesse: http://br.groups.yahoo.com/group/shell-script/ <*> Para sair deste grupo, envie um e-mail para: shell-script-unsubscr...@yahoogrupos.com.br <*> O uso que você faz do Yahoo! Grupos está sujeito aos: http://br.yahoo.com/info/utos.html