Alguém que manja de PHP?

2007-07-17 Thread Sávio Ramos
Olá,

Tenho que coletar diversos anúncios de imóveis para fazer uma modelagem
linear do comportamento do mercado imobiliário. Em uma página de uma
Imobiliária existem muitos anúncios que eu gostaria de copiar o texto,
não é necessário a informação fotográfica nem outra informação visual
qualquer.

É muito chato ficar copiando e colando os dados. Como o endereço da
página é:

http://www.etica.com.br/revenda.php

Pergunto: é possível copiar a informação dos imóveis de forma
automática?

Obs: As informações que desejo são:

1) O código do imóvel que aparece na primeira tela, quando você
seleciona o bairro, o tipo e a faixa de valor do imóvel.

2) Os detalhes do imóvel daquele código, que é uma espécie de janela que
aparece quando se clica em cima do código que falei acima. Com as
informações de quantidades de quartos, bairro, endereço, valor, área,
garagem, posição, play, salão de festa, piscina, sauna, localização e
benefícios.

Grato.
-- 
Sávio M Ramos
Arquiteto, Rio, RJ
Usuário Linux desde 2000
www.debian.org



Re: Alguém que manja de PHP?

2007-07-17 Thread Thadeu Penna

On 7/17/07, Sávio Ramos <[EMAIL PROTECTED]> wrote:


Tenho que coletar diversos anúncios de imóveis para fazer uma modelagem
linear do comportamento do mercado imobiliário. Em uma página de uma
Imobiliária existem muitos anúncios que eu gostaria de copiar o texto,
não é necessário a informação fotográfica nem outra informação visual
qualquer.

É muito chato ficar copiando e colando os dados. Como o endereço da
página é:

http://www.etica.com.br/revenda.php

Pergunto: é possível copiar a informação dos imóveis de forma
automática?

Obs: As informações que desejo são:

1) O código do imóvel que aparece na primeira tela, quando você
seleciona o bairro, o tipo e a faixa de valor do imóvel.

2) Os detalhes do imóvel daquele código, que é uma espécie de janela que
aparece quando se clica em cima do código que falei acima. Com as
informações de quantidades de quartos, bairro, endereço, valor, área,
garagem, posição, play, salão de festa, piscina, sauna, localização e
benefícios.


Não é preciso PHP para fazer isto. Use o links2 como browser,
selecione as pesquisas e salve a saída como texto. Depois é só usar o
grep para filtrar o que você quiser. O php não faz nada além de gerar
a página HTML que você vê. O ideal seria   ver o código para checar se
é possível acessar a página diretamente por linha de comando;

--
Thadeu Penna
Prof.Associado - Instituto de Física
Universidade Federal Fluminense
http://profs.if.uff.br/tjpp/blog



Re: Alguém que manja de PHP?

2007-07-17 Thread Sávio Ramos
Em Tue, 17 Jul 2007 11:57:28 -0300
"Thadeu Penna" <[EMAIL PROTECTED]> escreveu:

> Não é preciso PHP para fazer isto. Use o links2 como browser,

Tentei elinks, links2 e w3m e não navegaram no "detalhes do imóvel"

> selecione as pesquisas e salve a saída como texto. Depois é só usar o

Não sei salvar como texto. Mas, também não funcionou...

> grep para filtrar o que você quiser. O php não faz nada além de gerar
> a página HTML que você vê. 

Mas, deve ser uma página diferente, pois aparece no meio da página que
você está vendo e com uma figura.

> O ideal seria   ver o código para checar se
> é possível acessar a página diretamente por linha de comando;

Depois que você seleciona "apartamento" no bairro "coisa_e_tal" com
preço "tal_e_coisa". Aparecem várias indicações que quando você clica
abre a tal página no meio da que você está vendo. Os navegadores de
modo texto não conseguem clicar nestes links. Só exibem o total de
imóveis encontrados com os links.


O tal link aparece no código da página assim:



  
Código
Endereço
Bairro
Tipo
Valor (R$)

 
  
  
 

 

F12135 





O link que o navegador em modo texto não navega é:

onclick="detalhesImovel(6665)





Pode ser que isto seja java, não? No início do código da página aparece:









Existem também mais duas linhas com a definição onclick:




Filiais









O problema possui solução?

-- 
Sávio M Ramos
Arquiteto, Rio, RJ
Usuário Linux desde 2000
www.debian.org



Re: Alguém que manja de PHP?

2007-07-17 Thread Thadeu Penna

Fiz o seguinte: Abri o swiftweasel.
Fui até a página e selecionei um imóvel.
No menu Arquivo, pedi para salvar como texto (imov1). Depois fiz
~$ iconv -f iso-8859-1 -t utf-8 imov1 | grep "\*:"
   *Tipo*: Apartamento 2 Quartos
   *Bairro*: Abolição
   *Valor*: R$ 55.000,00
   *Área útil*: 0 m²
   *Garagem*: 0
   *Posição*: Fundos
   *Vista*: Parcial
   *Sol*: Manhã/Tarde
   *Playground*: Sim
   *S. de Festas*: Sim
   *Piscina*: Não
   *Sauna*: Não
   *Localização*: CONJ DOS FERROVIÁRIOS JUNTINHO SUBURBANA
   *Benefícios*: *

Era isto que você queria ?


On 7/17/07, Sávio Ramos <[EMAIL PROTECTED]> wrote:

Em Tue, 17 Jul 2007 11:57:28 -0300
"Thadeu Penna" <[EMAIL PROTECTED]> escreveu:

> Não é preciso PHP para fazer isto. Use o links2 como browser,

Tentei elinks, links2 e w3m e não navegaram no "detalhes do imóvel"

> selecione as pesquisas e salve a saída como texto. Depois é só usar o

Não sei salvar como texto. Mas, também não funcionou...

> grep para filtrar o que você quiser. O php não faz nada além de gerar
> a página HTML que você vê.

Mas, deve ser uma página diferente, pois aparece no meio da página que
você está vendo e com uma figura.

> O ideal seria   ver o código para checar se
> é possível acessar a página diretamente por linha de comando;

Depois que você seleciona "apartamento" no bairro "coisa_e_tal" com
preço "tal_e_coisa". Aparecem várias indicações que quando você clica
abre a tal página no meio da que você está vendo. Os navegadores de
modo texto não conseguem clicar nestes links. Só exibem o total de
imóveis encontrados com os links.


O tal link aparece no código da página assim:



  
Código
Endereço
Bairro
Tipo
Valor (R$)

 
  
  




F12135 





O link que o navegador em modo texto não navega é:

onclick="detalhesImovel(6665)





Pode ser que isto seja java, não? No início do código da página aparece:









Existem também mais duas linhas com a definição onclick:




Filiais









O problema possui solução?

--
Sávio M Ramos
Arquiteto, Rio, RJ
Usuário Linux desde 2000
www.debian.org





--
Thadeu Penna
Prof.Associado - Instituto de Física
Universidade Federal Fluminense
http://profs.if.uff.br/tjpp/blog



Re: Alguém que manja de PHP?

2007-07-17 Thread Sávio Ramos
Em Tue, 17 Jul 2007 16:12:21 -0300
"Thadeu Penna" <[EMAIL PROTECTED]> escreveu:

> Era isto que você queria ?

Sim! O problema é fazer isto repetidamente para todos os imóveis da
lista...

-- 
Sávio M Ramos
Arquiteto, Rio, RJ
Usuário Linux desde 2000
www.debian.org



Re: Alguém que manja de PHP?

2007-07-17 Thread Junior Polegato - Linux

Sávio Ramos escreveu:

"Thadeu Penna" <[EMAIL PROTECTED]> escreveu:
  

Era isto que você queria ?


Sim! O problema é fazer isto repetidamente para todos os imóveis da
lista...
  


Seguinte, olhei o código e o que ele faz é executar uma função Ajax em 
javascript que introduz num certo ponto da página principal detalhes do 
imóvel. Para obter os detalhes separadamente, use:


wget --post-data="id=" http://www.etica.com.br/detalhes_imovel.php

onde este número "" em "id=" é o número passado na função 
detalhesImovel().


Dá um certo trampo, mas dá para fazer o que você quer sem grandes 
problemas. Se estiver a fim de desembolsar algo, posso perder umas 
horinhas de sono. ;-) 


Caso contrário, boa sorte na empreitada!

--
Atenciosamente,

  Junior Polegato

  Um peregrino de problemas; Um pergaminho de soluções!
  Página Profissional: http://www.juniorpolegato.com.br


--
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]



Re: Alguém que manja de PHP?

2007-07-19 Thread Fabio A Mazzarino

Thadeu:

Péra um pouco. Informações e motivos precisam ser corretos.

On 7/17/07, Thadeu Penna <[EMAIL PROTECTED]> wrote:


Não é preciso PHP para fazer isto. Use o links2 como browser,
selecione as pesquisas e salve a saída como texto. Depois é só usar o
grep para filtrar o que você quiser. O php não faz nada além de gerar
a página HTML que você vê.


O PHP faz *muito* mais que gerar páginas HTML. Tanto é que existem
extensões como o PHP-GTK que gera aplicações GTK, que de HTML não tem
nada.

É possível, inclusive, gerar daemons utilizando PHP. A questão é,
qual a linguagem mais apropriada para fazer isso?

Eu não acredito que seja apropriado usar PHP. Para uma interpretação
do html mais eficiente eu recomendo utilizar Perl. Mm pq algumas vezes
será possível seguir links e puxar informações de outras páginas.

De qq forma, é uma discussão boba esta. No fundo a linguagem mais
indicada é aquela que o usuário mais se adapta.


O ideal seria   ver o código para checar se
é possível acessar a página diretamente por linha de comando;


Como eu disse anteriormente. Se o usuário não conhece shell script, o
melhor a se fazer é usar PHP mm.

--
Doses Diárias - Achados de um Programador na Internet
http://dosesdiarias.seucaminho.com



Re: Alguém que manja de PHP?

2007-07-19 Thread Thadeu Penna

On 7/19/07, Fabio A Mazzarino <[EMAIL PROTECTED]> wrote:

 Thadeu:

 Péra um pouco. Informações e motivos precisam ser corretos.

On 7/17/07, Thadeu Penna <[EMAIL PROTECTED]> wrote:
>
> Não é preciso PHP para fazer isto. Use o links2 como browser,
> selecione as pesquisas e salve a saída como texto. Depois é só usar o
> grep para filtrar o que você quiser. O php não faz nada além de gerar
> a página HTML que você vê.

 O PHP faz *muito* mais que gerar páginas HTML. Tanto é que existem
extensões como o PHP-GTK que gera aplicações GTK, que de HTML não tem
nada.


Certo. Eu é que me expressei mal: eu queria dizer que naquele caso
específico, o PHP só gerava a página HTML e que para obter as
informações que o Sávio necessita, não é preciso saber PHP.

[]s
--
Thadeu Penna
Prof.Associado - Instituto de Física
Universidade Federal Fluminense
http://profs.if.uff.br/tjpp/blog