Alguém que manja de PHP?
Olá, Tenho que coletar diversos anúncios de imóveis para fazer uma modelagem linear do comportamento do mercado imobiliário. Em uma página de uma Imobiliária existem muitos anúncios que eu gostaria de copiar o texto, não é necessário a informação fotográfica nem outra informação visual qualquer. É muito chato ficar copiando e colando os dados. Como o endereço da página é: http://www.etica.com.br/revenda.php Pergunto: é possível copiar a informação dos imóveis de forma automática? Obs: As informações que desejo são: 1) O código do imóvel que aparece na primeira tela, quando você seleciona o bairro, o tipo e a faixa de valor do imóvel. 2) Os detalhes do imóvel daquele código, que é uma espécie de janela que aparece quando se clica em cima do código que falei acima. Com as informações de quantidades de quartos, bairro, endereço, valor, área, garagem, posição, play, salão de festa, piscina, sauna, localização e benefícios. Grato. -- Sávio M Ramos Arquiteto, Rio, RJ Usuário Linux desde 2000 www.debian.org
Re: Alguém que manja de PHP?
On 7/17/07, Sávio Ramos <[EMAIL PROTECTED]> wrote: Tenho que coletar diversos anúncios de imóveis para fazer uma modelagem linear do comportamento do mercado imobiliário. Em uma página de uma Imobiliária existem muitos anúncios que eu gostaria de copiar o texto, não é necessário a informação fotográfica nem outra informação visual qualquer. É muito chato ficar copiando e colando os dados. Como o endereço da página é: http://www.etica.com.br/revenda.php Pergunto: é possível copiar a informação dos imóveis de forma automática? Obs: As informações que desejo são: 1) O código do imóvel que aparece na primeira tela, quando você seleciona o bairro, o tipo e a faixa de valor do imóvel. 2) Os detalhes do imóvel daquele código, que é uma espécie de janela que aparece quando se clica em cima do código que falei acima. Com as informações de quantidades de quartos, bairro, endereço, valor, área, garagem, posição, play, salão de festa, piscina, sauna, localização e benefícios. Não é preciso PHP para fazer isto. Use o links2 como browser, selecione as pesquisas e salve a saída como texto. Depois é só usar o grep para filtrar o que você quiser. O php não faz nada além de gerar a página HTML que você vê. O ideal seria ver o código para checar se é possível acessar a página diretamente por linha de comando; -- Thadeu Penna Prof.Associado - Instituto de Física Universidade Federal Fluminense http://profs.if.uff.br/tjpp/blog
Re: Alguém que manja de PHP?
Em Tue, 17 Jul 2007 11:57:28 -0300 "Thadeu Penna" <[EMAIL PROTECTED]> escreveu: > Não é preciso PHP para fazer isto. Use o links2 como browser, Tentei elinks, links2 e w3m e não navegaram no "detalhes do imóvel" > selecione as pesquisas e salve a saída como texto. Depois é só usar o Não sei salvar como texto. Mas, também não funcionou... > grep para filtrar o que você quiser. O php não faz nada além de gerar > a página HTML que você vê. Mas, deve ser uma página diferente, pois aparece no meio da página que você está vendo e com uma figura. > O ideal seria ver o código para checar se > é possível acessar a página diretamente por linha de comando; Depois que você seleciona "apartamento" no bairro "coisa_e_tal" com preço "tal_e_coisa". Aparecem várias indicações que quando você clica abre a tal página no meio da que você está vendo. Os navegadores de modo texto não conseguem clicar nestes links. Só exibem o total de imóveis encontrados com os links. O tal link aparece no código da página assim: Código Endereço Bairro Tipo Valor (R$) F12135 O link que o navegador em modo texto não navega é: onclick="detalhesImovel(6665) Pode ser que isto seja java, não? No início do código da página aparece: Existem também mais duas linhas com a definição onclick: Filiais O problema possui solução? -- Sávio M Ramos Arquiteto, Rio, RJ Usuário Linux desde 2000 www.debian.org
Re: Alguém que manja de PHP?
Fiz o seguinte: Abri o swiftweasel. Fui até a página e selecionei um imóvel. No menu Arquivo, pedi para salvar como texto (imov1). Depois fiz ~$ iconv -f iso-8859-1 -t utf-8 imov1 | grep "\*:" *Tipo*: Apartamento 2 Quartos *Bairro*: Abolição *Valor*: R$ 55.000,00 *Área útil*: 0 m² *Garagem*: 0 *Posição*: Fundos *Vista*: Parcial *Sol*: Manhã/Tarde *Playground*: Sim *S. de Festas*: Sim *Piscina*: Não *Sauna*: Não *Localização*: CONJ DOS FERROVIÁRIOS JUNTINHO SUBURBANA *Benefícios*: * Era isto que você queria ? On 7/17/07, Sávio Ramos <[EMAIL PROTECTED]> wrote: Em Tue, 17 Jul 2007 11:57:28 -0300 "Thadeu Penna" <[EMAIL PROTECTED]> escreveu: > Não é preciso PHP para fazer isto. Use o links2 como browser, Tentei elinks, links2 e w3m e não navegaram no "detalhes do imóvel" > selecione as pesquisas e salve a saída como texto. Depois é só usar o Não sei salvar como texto. Mas, também não funcionou... > grep para filtrar o que você quiser. O php não faz nada além de gerar > a página HTML que você vê. Mas, deve ser uma página diferente, pois aparece no meio da página que você está vendo e com uma figura. > O ideal seria ver o código para checar se > é possível acessar a página diretamente por linha de comando; Depois que você seleciona "apartamento" no bairro "coisa_e_tal" com preço "tal_e_coisa". Aparecem várias indicações que quando você clica abre a tal página no meio da que você está vendo. Os navegadores de modo texto não conseguem clicar nestes links. Só exibem o total de imóveis encontrados com os links. O tal link aparece no código da página assim: Código Endereço Bairro Tipo Valor (R$) F12135 O link que o navegador em modo texto não navega é: onclick="detalhesImovel(6665) Pode ser que isto seja java, não? No início do código da página aparece: Existem também mais duas linhas com a definição onclick: Filiais O problema possui solução? -- Sávio M Ramos Arquiteto, Rio, RJ Usuário Linux desde 2000 www.debian.org -- Thadeu Penna Prof.Associado - Instituto de Física Universidade Federal Fluminense http://profs.if.uff.br/tjpp/blog
Re: Alguém que manja de PHP?
Em Tue, 17 Jul 2007 16:12:21 -0300 "Thadeu Penna" <[EMAIL PROTECTED]> escreveu: > Era isto que você queria ? Sim! O problema é fazer isto repetidamente para todos os imóveis da lista... -- Sávio M Ramos Arquiteto, Rio, RJ Usuário Linux desde 2000 www.debian.org
Re: Alguém que manja de PHP?
Sávio Ramos escreveu: "Thadeu Penna" <[EMAIL PROTECTED]> escreveu: Era isto que você queria ? Sim! O problema é fazer isto repetidamente para todos os imóveis da lista... Seguinte, olhei o código e o que ele faz é executar uma função Ajax em javascript que introduz num certo ponto da página principal detalhes do imóvel. Para obter os detalhes separadamente, use: wget --post-data="id=" http://www.etica.com.br/detalhes_imovel.php onde este número "" em "id=" é o número passado na função detalhesImovel(). Dá um certo trampo, mas dá para fazer o que você quer sem grandes problemas. Se estiver a fim de desembolsar algo, posso perder umas horinhas de sono. ;-) Caso contrário, boa sorte na empreitada! -- Atenciosamente, Junior Polegato Um peregrino de problemas; Um pergaminho de soluções! Página Profissional: http://www.juniorpolegato.com.br -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]
Re: Alguém que manja de PHP?
Thadeu: Péra um pouco. Informações e motivos precisam ser corretos. On 7/17/07, Thadeu Penna <[EMAIL PROTECTED]> wrote: Não é preciso PHP para fazer isto. Use o links2 como browser, selecione as pesquisas e salve a saída como texto. Depois é só usar o grep para filtrar o que você quiser. O php não faz nada além de gerar a página HTML que você vê. O PHP faz *muito* mais que gerar páginas HTML. Tanto é que existem extensões como o PHP-GTK que gera aplicações GTK, que de HTML não tem nada. É possível, inclusive, gerar daemons utilizando PHP. A questão é, qual a linguagem mais apropriada para fazer isso? Eu não acredito que seja apropriado usar PHP. Para uma interpretação do html mais eficiente eu recomendo utilizar Perl. Mm pq algumas vezes será possível seguir links e puxar informações de outras páginas. De qq forma, é uma discussão boba esta. No fundo a linguagem mais indicada é aquela que o usuário mais se adapta. O ideal seria ver o código para checar se é possível acessar a página diretamente por linha de comando; Como eu disse anteriormente. Se o usuário não conhece shell script, o melhor a se fazer é usar PHP mm. -- Doses Diárias - Achados de um Programador na Internet http://dosesdiarias.seucaminho.com
Re: Alguém que manja de PHP?
On 7/19/07, Fabio A Mazzarino <[EMAIL PROTECTED]> wrote: Thadeu: Péra um pouco. Informações e motivos precisam ser corretos. On 7/17/07, Thadeu Penna <[EMAIL PROTECTED]> wrote: > > Não é preciso PHP para fazer isto. Use o links2 como browser, > selecione as pesquisas e salve a saída como texto. Depois é só usar o > grep para filtrar o que você quiser. O php não faz nada além de gerar > a página HTML que você vê. O PHP faz *muito* mais que gerar páginas HTML. Tanto é que existem extensões como o PHP-GTK que gera aplicações GTK, que de HTML não tem nada. Certo. Eu é que me expressei mal: eu queria dizer que naquele caso específico, o PHP só gerava a página HTML e que para obter as informações que o Sávio necessita, não é preciso saber PHP. []s -- Thadeu Penna Prof.Associado - Instituto de Física Universidade Federal Fluminense http://profs.if.uff.br/tjpp/blog