On Mar 8, 2010, at 2:38 PM, Jorge Sarmiento wrote:

> 2010/3/6 Pedro Muñoz del Río <[email protected]>
> Como pregunta adicional, ¿cuan legal es descargar esa información de
> forma masiva desde la web de páginas blancas?
> 
> Esa información deebería encontrarse en los términos de uso del website. En 
> los términos de uso debe decir que el límite es N consultas al día. 
> 
> De todas formas te recomendaría consultar con un abogado antes de meterte en 
> un problema.

Bueno, YELL permite que google (el web scrapper mas grande y exitoso del mundo) 
tenga copiadas mas de 167,000 páginas, así que no creo que hagan problemas.

Si quieres saber que es lo que _no_ permiten scrappear, solo debes respetar su 
robots.txt:

http://www.paginasamarillas.com.pe/robots.txt

Saludos.


Gustavo Picon
https://tabo.pe/





Attachment: smime.p7s
Description: S/MIME cryptographic signature

_______________________________________________
Lista de correo Linux-plug
Temática: Discusión general sobre Linux
Peruvian Linux User Group (http://www.linux.org.pe)

Participa suscribiéndote y escribiendo a:  [email protected]
Para darte de alta, de baja  o hacer ajustes a tu suscripción visita:
http://listas.linux.org.pe/mailman/listinfo/linux-plug

IMPORTANTE: Reglas y recomendaciones
http://www.linux.org.pe/listas/reglas.php
http://www.linux.org.pe/listas/comportamiento.php
http://www.linux.org.pe/listas/recomendaciones.php

Responder a