Pedro,

Tabo tiene razón scrapy te podría ser de ayuda, pero a modo de
ejemplo, tengo implementado un ejemplo de web scrapping con python, se
encuentra en:

http://pastebin.com/BDJ9FHbi


El ejemplo lo hice algunos años para mis clases pero las líneas estan
comentadas por lo que pueden modificarlo y ajustarlo a sus necesidades

Saludos,

--------------------------------
Alfonso de la Guarda
Centro Open Source(COS)
http://www.cos-la.net
http://alfonsodg.net
   Telef. 991935157
1024D/B23B24A4
5469 ED92 75A3 BBDB FD6B  58A5 54A1 851D B23B 24A4



2010/3/5 Gustavo Picon <[email protected]>:
>
> On Mar 5, 2010, at 11:34 AM, David Wong-Aitken wrote:
>
>> sacar la data de la web? depende de qué es lo que quiero sacar. Qué es lo 
>> que quisieras sacar?
>>
>> Lo mas simple es ver la web y apuntar el dato, al menos que quieras 
>> automatizarlo, para lo cual puedes hacer un script en perl o python. Me 
>> parece que alguno vi por la web hace tiempo, pero no es difícil.
>
> Esa técnica se llama web scrapping. Para cosas sencillas se puede usar 
> BeautifulSoup en python o Mechanize en Perl. Si lo que quieres es extraer 
> TODO lo que hay en páginas amarillas, te convendría algo mas especializado, 
> como http://scrapy.org/
>
>
>
> Gustavo Picon
> https://tabo.pe/
>
>
>
>
>
>
> _______________________________________________
> Lista de correo Linux-plug
> Temática: Discusión general sobre Linux
> Peruvian Linux User Group (http://www.linux.org.pe)
>
> Participa suscribiéndote y escribiendo a:  [email protected]
> Para darte de alta, de baja  o hacer ajustes a tu suscripción visita:
> http://listas.linux.org.pe/mailman/listinfo/linux-plug
>
> IMPORTANTE: Reglas y recomendaciones
> http://www.linux.org.pe/listas/reglas.php
> http://www.linux.org.pe/listas/comportamiento.php
> http://www.linux.org.pe/listas/recomendaciones.php
>
_______________________________________________
Lista de correo Linux-plug
Temática: Discusión general sobre Linux
Peruvian Linux User Group (http://www.linux.org.pe)

Participa suscribiéndote y escribiendo a:  [email protected]
Para darte de alta, de baja  o hacer ajustes a tu suscripción visita:
http://listas.linux.org.pe/mailman/listinfo/linux-plug

IMPORTANTE: Reglas y recomendaciones
http://www.linux.org.pe/listas/reglas.php
http://www.linux.org.pe/listas/comportamiento.php
http://www.linux.org.pe/listas/recomendaciones.php

Responder a