Félix Pupo escribió:
låzaro escribió:
Yo lo haría asi:

wget -R -chttp://www.zytrax.com/books/ldap

porue mirror?

wget --recursive --page-requisites --html-extension --convert-links
--restrict-file-names=windows --domainswww.zytrax.com  <http://www.zytrax.com>  
--no-parent
--user-agent="" -e robots=offwww.zytrax.com/books/ldap  
<http://www.zytrax.com/books/ldap>

A Lázaro:

La opción mirror es la recomendada en el manual para descargar un sitio; en realidad es la combinación de varios parámetros:
--recursive --timestamping --level=inf --no-remove-listing

El parámetro -R que sugieres en realidad lo que permite es pasar una lista de elementos a rechazar


A Félix:

Los parámetros que recomiendas no eliminan el problema. Al parecer hay páginas con cadenas de consulta que se repiten, como el ejemplo que puse (hay muchas más por el estilo):

/book/ldap/todo.html
/book/ldap/todo.html?pf=yes
/book/ldap/todo.html?pf=yes?pf=yes
/book/ldap/todo.html?pf=yes?pf=yes?pf=yes
/book/ldap/todo.html?pf=yes?pf=yes?pf=yes?pf=yes

Por cierto, de acuerdo al manual, el parámetro "--html-extension" ha quedado obsoleto desde la versión 1.12 y ha sido reemplazado por "--adjust-extension" (ese fue el motivo por el cual utilicé esta variante)

Saludos, Hugo
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: 
<http://listas.jovenclub.cu/pipermail/gutl-l/attachments/20120413/7f8e2258/attachment.htm>
______________________________________________________________________
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Reply via email to