Re: [Gutl-l] OT: Descargar el pdf del granma [Resuelto]

2014-03-25 Por tema Abel Bordón Durán
Hola Colegas!!!

Disculpen que retome un tema pasado pero quería dar las gracias a los
participantes y por darme la solución al problema gracias otra vez 

 

 

Abel Bordón Durán

Administrador de Red

Facultad de Ciencias Agropecuarias

Universidad de Ciego de Ávila

jabber:   abor...@jabber.unica.cu 
telf. 225702 ext. 1054

 


Participe en el Evento Internacional UNICA 2014, del 14 al 16 de octubre del 
2014. Ciego de Ávila, Cuba

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

 próxima parte 
Se ha borrado un adjunto en formato HTML...
URL: 

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l


Re: [Gutl-l] OT: Descargar el pdf del granma [Resuelto]

2014-03-23 Por tema Hugo Florentino

On Sat, 22 Mar 2014 21:51:00 +0100, Matthias Apitz wrote:

... la idea es "si existe la edición de 16 páginas, la bajamos, sino
intendamos la de 8 páginas"


Fue lo que quise decir (quizás no de la manera ideal, tienes razón).
Francamente pensaba que ya eso había quedado claro, y solo pretendía 
hacer énfasis en evitar el intento fallido de obtener el archivo, con lo 
cual el funcionamiento del script es mas predecible y el log queda más 
limpio.


--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma [Resuelto]

2014-03-23 Por tema Hugo Florentino

On Sat, 22 Mar 2014 21:51:00 +0100, Matthias Apitz wrote:


... la idea es "si existe la edición de 16 páginas, la bajamos, sino 
intentamos la de 8 páginas"



Fue lo que quise decir (quizás no de la manera ideal, tienes razón).
Francamente pensaba que ya eso había quedado claro, yo solo pretendía 
hacer énfasis en evitar el intento fallido de obtener el archivo, con lo 
cual el funcionamiento del script es mas predecible y el log queda más 
limpio.



P.D. Mis disculpas si este mensaje llega doble, es que lo envié y sin 
embargo nunca lo vi aparecer en la lista.


--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma [Resuelto]

2014-03-22 Por tema Matthias Apitz

Hola Hugo,

Ya sé que soy un pesado, pero ...

El día Saturday, March 22, 2014 a las 04:23:40PM -0400, Hugo Florentino 
escribió:

> La idea es que el script detecte (sin intentar descargar) si existe la 
> edicion de 8 páginas o la de 16 y solo entonces la descargue con el 
> nombre granma_-mm-dd.pdf

... la idea es "si existe la edición de 16 páginas, la bajamos, sino
intendamos la de 8 páginas"

> URLGRANMA='http://www.granma.cu/file/pdf/'$(date +%Y/%m/%d)'/G_'$(date 
> +%Y%m%d)
> (wget --spider -q $URLGRANMA'17.pdf') && EDICION='17' || EDICION='09'
> wget -bc $URLGRANMA$EDICION'.pdf' -O granma_$(date +%F).pdf -o 
> granma.log

Tu código está bien, no obstante. :-)

matthias
-- 
Sent from my FreeBSD netbook

Matthias Apitz, , http://www.unixarea.de/ f: +49-170-4527211
UNIX since V7 on PDP-11, UNIX on mainframe since ESER 1055 (IBM /370)
UNIX on x86 since SVR4.2 UnixWare 2.1.2, FreeBSD since 2.2.5

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l


Re: [Gutl-l] OT: Descargar el pdf del granma [Resuelto]

2014-03-22 Por tema Hugo Florentino

On Sat, 22 Mar 2014 18:58:52 +0100, Matthias Apitz wrote:

El día Saturday, March 22, 2014 a las 12:29:53PM -0400, Juset
Castañeda A escribió:

Para el que no sepa mucho bash no se complique, esto es lo que debe 
de

añadir a el bash que habían creado para descargar el Granma

FECHA=$(date +%Y/%m/%d)
DATE=$(date +%Y%m%d)
GRANMA='http://www.granma.cu/file/pdf/'$FECHA'/G_'$DATE'09.pdf'
GRANMAV='http://www.granma.cu/file/pdf/'$FECHA'/G_'$DATE'17.pdf'

VIE=$(date +%A)
  if [ "$VIE" = "viernes" ]; then


Hola,

Dos cosas. Si 'date +%A' devuelve el nombre del día en español
depende del ambiente:

# LANG=C
# date +%A
Saturday

Y en cuanto a los 16 páginas, no todos los viernes Granma sale con 16
páginas (días feriados, por ejemplo) y a veces Granma sale con 16
páginas aunque no es viernes. Mejor será simplemente intentar bajar 
la
versión G_'$DATE'17.pdf y si no está la versión G_'$DATE'09.pdf con 
algo

tan simple como

# wget .../G_'$DATE'17.pdf || wget .../G_'$DATE'09.pdf



OK, aqui tienen una variante basada parcialmente en los aportes de 
Juset y Matthias;
La idea es que el script detecte (sin intentar descargar) si existe la 
edicion de 8 páginas o la de 16 y solo entonces la descargue con el 
nombre granma_-mm-dd.pdf
De esta manera uno puede tener un historial de ediciones y además los 
archivos pueden filtrarse y ordenarse con más comodidad que si la fecha 
estuviese en un formato no-ISO


URLGRANMA='http://www.granma.cu/file/pdf/'$(date +%Y/%m/%d)'/G_'$(date 
+%Y%m%d)

(wget --spider -q $URLGRANMA'17.pdf') && EDICION='17' || EDICION='09'
wget -bc $URLGRANMA$EDICION'.pdf' -O granma_$(date +%F).pdf -o 
granma.log


--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma [Resuelto]

2014-03-22 Por tema Matthias Apitz
El día Saturday, March 22, 2014 a las 12:29:53PM -0400, Juset Castañeda A 
escribió:

> Para el que no sepa mucho bash no se complique, esto es lo que debe de  
> añadir a el bash que habían creado para descargar el Granma
> 
> FECHA=$(date +%Y/%m/%d)
> DATE=$(date +%Y%m%d)
> GRANMA='http://www.granma.cu/file/pdf/'$FECHA'/G_'$DATE'09.pdf'
> GRANMAV='http://www.granma.cu/file/pdf/'$FECHA'/G_'$DATE'17.pdf'
> 
> VIE=$(date +%A)
>   if [ "$VIE" = "viernes" ]; then

Hola,

Dos cosas. Si 'date +%A' devuelve el nombre del día en español
depende del ambiente:

# LANG=C
# date +%A
Saturday

Y en cuanto a los 16 páginas, no todos los viernes Granma sale con 16
páginas (días feriados, por ejemplo) y a veces Granma sale con 16
páginas aunque no es viernes. Mejor será simplemente intentar bajar la
versión G_'$DATE'17.pdf y si no está la versión G_'$DATE'09.pdf con algo
tan simple como

# wget .../G_'$DATE'17.pdf || wget .../G_'$DATE'09.pdf

Saludos

matthias
-- 
Matthias Apitz   |  /"\ ASCII Ribbon Campaign: www.asciiribbon.org
E-mail: g...@unixarea.de |  \ / - No HTML/RTF in E-mail
WWW: http://www.unixarea.de/ |   X  - No proprietary attachments
phone: +49-170-4527211   |  / \ - Respect for open standards

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l


Re: [Gutl-l] OT: Descargar el pdf del granma [Resuelto]

2014-03-22 Por tema Juset Castañeda A
En Fri, 21 Mar 2014 17:49:35 -0400, Juset Castañeda A  
 escribió:



En Fri, 21 Mar 2014 15:40:44 -0400, Matthias Apitz 
escribió:


El día Friday, March 21, 2014 a las 12:44:27PM -0400, Abel Bordón Durán
escribió:


Hola listeros

Acudo a ustedes una vez más con una duda, primero decirles que no se
programar casi nada, ahora bien tenía en mi server un script que se
encargaba de descargarme el pdf del Granma y el juventud para ponerlo  
al

servicio de mi red y así liberar ancho de banda pero resulta que desde
que
Granma cambió su portada también cambio la url de descarga del Granma
que
pone de nombre en el fichero de descarga la fecha + la cantidad de
páginas
que tiene, lo de la fecha era fácil pues antes estaba así y lo había
resuelto utilizando una variable pero ahora no sé cómo ponerle el # de
páginas ya que no siempre es constante, entonces mi gran pregunta es
cómo
hacerlo alguien tiene el mismo servicio montado o sabe cómo hacerlo??


Hola,

He echoo un vistazo y pienso lo hacen mal. Para hoy existen

http://www.granma.cu/file/pdf/2014/03/21/G_2014032101.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032102.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032103.pdf
...
http://www.granma.cu/file/pdf/2014/03/21/G_2014032116.pdf

para las páginas sueltas y para todas las páginas en un solo fichero

http://www.granma.cu/file/pdf/2014/03/21/G_2014032117.pdf

Fíjate, hoy viernes, son 16 páginas y llaman el fichero entero
17.pdf en vez de usar otro nombre, hasta dicen en la página en HTML
" completa 17 páginas" -- un error.


Pues les tengo una buena al final si sigue un patrón, todos los días son
09 al final excepto los viernes que son 17, ya por lo menos tiene un
patrón para la descargas ya lo otro es programarlo con una condición.



Para el que no sepa mucho bash no se complique, esto es lo que debe de  
añadir a el bash que habían creado para descargar el Granma


FECHA=$(date +%Y/%m/%d)
DATE=$(date +%Y%m%d)
GRANMA='http://www.granma.cu/file/pdf/'$FECHA'/G_'$DATE'09.pdf'
GRANMAV='http://www.granma.cu/file/pdf/'$FECHA'/G_'$DATE'17.pdf'

VIE=$(date +%A)
 if [ "$VIE" = "viernes" ]; then
   wget -r -nd $GRANMAV -o /var/www/granma.log
   mv 'G_'$DATE'17.pdf'  granma.pdf
else
   wget -r -nd $GRANMA -o /var/www/granma.log
   mv 'G_'$DATE'09.pdf'  granma.pdf
 fi


--
Saludos, Juset
Administrador del Sistema Informatico
Unidad Empresarial de Base Provari Camaguey
Telf: (53)(32) 261844

GNU/Linux Debian Wheezy
Linux user  # 383170
"El tiempo no se gasta, se gasta la vida de quien lo pierde"

--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Servilio Afre Puentes
On Fri, Mar 21 2014, Matthias Apitz wrote:

> El día Friday, March 21, 2014 a las 04:38:39PM -0400, Servilio Afre Puentes 
> escribió:
>
>> > Pues, como Granma sale o con 8 o con 16 páginas, puedes bajar el fichero
>> > pdf//mm/dd/G_mmdd17.pdf y si esto va, está bien, si no bajas
>> > pdf//mm/dd/G_mmdd09.pdf (con 8 páginas) porque será un día
>> > con 8 páginas.
>> >
>> > Mala idea esta. ¿Alguien de Granma.cu lee acá?
>> 
>> Y con la librería requests de Python se puede bajar automático el
>> documento correcto:
>> 
>> #+BEGIN_SRC python
>> import datetime
>> import requests
>> 
>> 
>> granma_url_pattern = 
>> 'http://www.granma.cu/file/pdf/{year}/{month:02d}/{day:02d}/G_{year}{month:02d}{day:02d}{page:02d}.pdf'
>> granma_file_pattern = 'granma_{year}{month:02d}{day:02d}.pdf'
>> 
>> 
>> def bajar_granma(fecha):
>> for p in (17, 8):
>
> No hablo Python, pero, ¿no debería decir:
>
> for p in (17, 9):
> ...

Sí, debería ser un 9.

Gracias,

Servilio

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Juset Castañeda A
En Fri, 21 Mar 2014 15:40:44 -0400, Matthias Apitz   
escribió:


El día Friday, March 21, 2014 a las 12:44:27PM -0400, Abel Bordón Durán  
escribió:



Hola listeros

Acudo a ustedes una vez más con una duda, primero decirles que no se
programar casi nada, ahora bien tenía en mi server un script que se
encargaba de descargarme el pdf del Granma y el juventud para ponerlo al
servicio de mi red y así liberar ancho de banda pero resulta que desde  
que
Granma cambió su portada también cambio la url de descarga del Granma  
que
pone de nombre en el fichero de descarga la fecha + la cantidad de  
páginas

que tiene, lo de la fecha era fácil pues antes estaba así y lo había
resuelto utilizando una variable pero ahora no sé cómo ponerle el # de
páginas ya que no siempre es constante, entonces mi gran pregunta es  
cómo

hacerlo alguien tiene el mismo servicio montado o sabe cómo hacerlo??


Hola,

He echoo un vistazo y pienso lo hacen mal. Para hoy existen

http://www.granma.cu/file/pdf/2014/03/21/G_2014032101.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032102.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032103.pdf
...
http://www.granma.cu/file/pdf/2014/03/21/G_2014032116.pdf

para las páginas sueltas y para todas las páginas en un solo fichero

http://www.granma.cu/file/pdf/2014/03/21/G_2014032117.pdf

Fíjate, hoy viernes, son 16 páginas y llaman el fichero entero
17.pdf en vez de usar otro nombre, hasta dicen en la página en HTML
" completa 17 páginas" -- un error.


Pues les tengo una buena al final si sigue un patrón, todos los días son  
09 al final excepto los viernes que son 17, ya por lo menos tiene un  
patrón para la descargas ya lo otro es programarlo con una condición.


--
Saludos, Juset
Administrador del Sistema Informatico
Unidad Empresarial de Base Provari Camaguey
Telf: (53)(32) 261844

GNU/Linux Debian Wheezy
Linux user  # 383170
"El tiempo no se gasta, se gasta la vida de quien lo pierde"

--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Abel Bordón Durán
Hola listero

Bueno a ver comienzo Joel en ecoimpex esa sería una opción si fuese un único
pdf de lo contrario no sé si se pudiera hacer un conteo y solamente tomar el
pdf con el # mas grande algo asi como con un siclo y tomar el último tomado
que me parece que a eso es que se refiere nuestro amigo Servilio aunque
aclaro no se nada de programación ni de pyton entonces con no sería mejor un
hacerlo con un ciclo for tal vez?? Repito no se programar xDDD  

 

Abel Bordón Durán

Administrador de Red

Facultad de Ciencias Agropecuarias

Universidad de Ciego de Ávila

jabber:   abor...@jabber.unica.cu 
telf. 225702 ext. 1054

 


Participe en el Evento Internacional UNICA 2014, del 14 al 16 de octubre del 
2014. Ciego de Ávila, Cuba

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

 próxima parte 
Se ha borrado un adjunto en formato HTML...
URL: 

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l


Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Matthias Apitz
El día Friday, March 21, 2014 a las 04:38:39PM -0400, Servilio Afre Puentes 
escribió:

> > Pues, como Granma sale o con 8 o con 16 páginas, puedes bajar el fichero
> > pdf//mm/dd/G_mmdd17.pdf y si esto va, está bien, si no bajas
> > pdf//mm/dd/G_mmdd09.pdf (con 8 páginas) porque será un día
> > con 8 páginas.
> >
> > Mala idea esta. ¿Alguien de Granma.cu lee acá?
> 
> Y con la librería requests de Python se puede bajar automático el
> documento correcto:
> 
> #+BEGIN_SRC python
> import datetime
> import requests
> 
> 
> granma_url_pattern = 
> 'http://www.granma.cu/file/pdf/{year}/{month:02d}/{day:02d}/G_{year}{month:02d}{day:02d}{page:02d}.pdf'
> granma_file_pattern = 'granma_{year}{month:02d}{day:02d}.pdf'
> 
> 
> def bajar_granma(fecha):
> for p in (17, 8):

No hablo Python, pero, ¿no debería decir:

for p in (17, 9):
...


matthias
-- 
Sent from my FreeBSD netbook

Matthias Apitz, , http://www.unixarea.de/ f: +49-170-4527211
UNIX since V7 on PDP-11, UNIX on mainframe since ESER 1055 (IBM /370)
UNIX on x86 since SVR4.2 UnixWare 2.1.2, FreeBSD since 2.2.5

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l


Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Servilio Afre Puentes
On Fri, Mar 21 2014, Matthias Apitz wrote:

> El día Friday, March 21, 2014 a las 12:44:27PM -0400, Abel Bordón Durán 
> escribió:
>
>> Hola listeros
>> 
>> Acudo a ustedes una vez más con una duda, primero decirles que no se
>> programar casi nada, ahora bien tenía en mi server un script que se
>> encargaba de descargarme el pdf del Granma y el juventud para ponerlo al
>> servicio de mi red y así liberar ancho de banda pero resulta que desde que
>> Granma cambió su portada también cambio la url de descarga del Granma que
>> pone de nombre en el fichero de descarga la fecha + la cantidad de páginas
>> que tiene, lo de la fecha era fácil pues antes estaba así y lo había
>> resuelto utilizando una variable pero ahora no sé cómo ponerle el # de
>> páginas ya que no siempre es constante, entonces mi gran pregunta es cómo
>> hacerlo alguien tiene el mismo servicio montado o sabe cómo hacerlo??
>
> Hola,
>
> He echoo un vistazo y pienso lo hacen mal. Para hoy existen
>
> http://www.granma.cu/file/pdf/2014/03/21/G_2014032101.pdf
> http://www.granma.cu/file/pdf/2014/03/21/G_2014032102.pdf
> http://www.granma.cu/file/pdf/2014/03/21/G_2014032103.pdf
> ...
> http://www.granma.cu/file/pdf/2014/03/21/G_2014032116.pdf
>
> para las páginas sueltas y para todas las páginas en un solo fichero
>
> http://www.granma.cu/file/pdf/2014/03/21/G_2014032117.pdf
>
> Fíjate, hoy viernes, son 16 páginas y llaman el fichero entero
> 17.pdf en vez de usar otro nombre, hasta dicen en la página en HTML
> " completa 17 páginas" -- un error.
>
> Pues, como Granma sale o con 8 o con 16 páginas, puedes bajar el fichero
> pdf//mm/dd/G_mmdd17.pdf y si esto va, está bien, si no bajas
> pdf//mm/dd/G_mmdd09.pdf (con 8 páginas) porque será un día
> con 8 páginas.
>
> Mala idea esta. ¿Alguien de Granma.cu lee acá?

Y con la librería requests de Python se puede bajar automático el
documento correcto:

#+BEGIN_SRC python
import datetime
import requests


granma_url_pattern = 
'http://www.granma.cu/file/pdf/{year}/{month:02d}/{day:02d}/G_{year}{month:02d}{day:02d}{page:02d}.pdf'
granma_file_pattern = 'granma_{year}{month:02d}{day:02d}.pdf'


def bajar_granma(fecha):
for p in (17, 8):
url = granma_url_pattern.format(year = fecha.year,
month = fecha.month,
day = fecha.day,
page = p)
r = requests.head(url)
if r.status_code != 200:
continue
print url
granma_filename = granma_file_pattern.format(year = fecha.year,
 month = fecha.month,
 day = fecha.day)
r = requests.get(url, stream=True)
with open(granma_filename, 'wb') as fd:
for chunk in r.iter_content(1024):
fd.write(chunk)
break


bajar_granma(datetime.datetime.now())
#+END_SRC

Desde el «shell» se debe poder hacer con la librería LWP (libwww-perl)
instalada con los comandos HEAD y GET.

Servilio

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Juset Castañeda A
En Fri, 21 Mar 2014 15:40:44 -0400, Matthias Apitz   
escribió:


El día Friday, March 21, 2014 a las 12:44:27PM -0400, Abel Bordón Durán  
escribió:



Hola listeros

Acudo a ustedes una vez más con una duda, primero decirles que no se
programar casi nada, ahora bien tenía en mi server un script que se
encargaba de descargarme el pdf del Granma y el juventud para ponerlo al
servicio de mi red y así liberar ancho de banda pero resulta que desde  
que
Granma cambió su portada también cambio la url de descarga del Granma  
que
pone de nombre en el fichero de descarga la fecha + la cantidad de  
páginas

que tiene, lo de la fecha era fácil pues antes estaba así y lo había
resuelto utilizando una variable pero ahora no sé cómo ponerle el # de
páginas ya que no siempre es constante, entonces mi gran pregunta es  
cómo

hacerlo alguien tiene el mismo servicio montado o sabe cómo hacerlo??


Hola,

He echoo un vistazo y pienso lo hacen mal. Para hoy existen

http://www.granma.cu/file/pdf/2014/03/21/G_2014032101.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032102.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032103.pdf
...
http://www.granma.cu/file/pdf/2014/03/21/G_2014032116.pdf

para las páginas sueltas y para todas las páginas en un solo fichero

http://www.granma.cu/file/pdf/2014/03/21/G_2014032117.pdf

Fíjate, hoy viernes, son 16 páginas y llaman el fichero entero
17.pdf en vez de usar otro nombre, hasta dicen en la página en HTML
" completa 17 páginas" -- un error.

Pues, como Granma sale o con 8 o con 16 páginas, puedes bajar el fichero
pdf//mm/dd/G_mmdd17.pdf y si esto va, está bien, si no bajas
pdf//mm/dd/G_mmdd09.pdf (con 8 páginas) porque será un día
con 8 páginas.

Mala idea esta. ¿Alguien de Granma.cu lee acá?



Colega yo les tire un comentario en la pagina de ellos diciendo que al  
menos lo dejaran el el dia es decir G_20140321.pdf pero hasta ahora no he  
recibido respuestas, y en la pagina no hay ningún contacto al que te  
puedas dirigir.

--
Saludos, Juset
Administrador del Sistema Informatico
Unidad Empresarial de Base Provari Camaguey
Telf: (53)(32) 261844

GNU/Linux Debian Wheezy
Linux user  # 383170
"El tiempo no se gasta, se gasta la vida de quien lo pierde"

--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que est� limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Matthias Apitz
El día Friday, March 21, 2014 a las 12:44:27PM -0400, Abel Bordón Durán 
escribió:

> Hola listeros
> 
> Acudo a ustedes una vez más con una duda, primero decirles que no se
> programar casi nada, ahora bien tenía en mi server un script que se
> encargaba de descargarme el pdf del Granma y el juventud para ponerlo al
> servicio de mi red y así liberar ancho de banda pero resulta que desde que
> Granma cambió su portada también cambio la url de descarga del Granma que
> pone de nombre en el fichero de descarga la fecha + la cantidad de páginas
> que tiene, lo de la fecha era fácil pues antes estaba así y lo había
> resuelto utilizando una variable pero ahora no sé cómo ponerle el # de
> páginas ya que no siempre es constante, entonces mi gran pregunta es cómo
> hacerlo alguien tiene el mismo servicio montado o sabe cómo hacerlo??

Hola,

He echoo un vistazo y pienso lo hacen mal. Para hoy existen

http://www.granma.cu/file/pdf/2014/03/21/G_2014032101.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032102.pdf
http://www.granma.cu/file/pdf/2014/03/21/G_2014032103.pdf
...
http://www.granma.cu/file/pdf/2014/03/21/G_2014032116.pdf

para las páginas sueltas y para todas las páginas en un solo fichero

http://www.granma.cu/file/pdf/2014/03/21/G_2014032117.pdf

Fíjate, hoy viernes, son 16 páginas y llaman el fichero entero
17.pdf en vez de usar otro nombre, hasta dicen en la página en HTML
" completa 17 páginas" -- un error.

Pues, como Granma sale o con 8 o con 16 páginas, puedes bajar el fichero
pdf//mm/dd/G_mmdd17.pdf y si esto va, está bien, si no bajas
pdf//mm/dd/G_mmdd09.pdf (con 8 páginas) porque será un día
con 8 páginas.

Mala idea esta. ¿Alguien de Granma.cu lee acá?

Saludos

matthias


-- 
Sent from my FreeBSD netbook

Matthias Apitz, , http://www.unixarea.de/ f: +49-170-4527211
UNIX since V7 on PDP-11, UNIX on mainframe since ESER 1055 (IBM /370)
UNIX on x86 since SVR4.2 UnixWare 2.1.2, FreeBSD since 2.2.5

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l


Re: [Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema joel

Hola colega,

con que descargas pues con wget si usas la opción -A puedes utilizar 
patrones ejemplo pepe*.dbf,

quizás por ahi este tu solución.


--
Saludos

  Joel  Ventura Castillo
 J' Grupo Informática
  Empresa Importadora - Exportadora ILECO
 Dir.: O' Reilly No. 152 e/ San Ignacio y Mercaderes,
   Habana Vieja, Cuba.
   E-Mail: j...@ecoimpex.com.cu
   Teléf.: 8625081 al 84, Ext. 156


El 21/03/2014 11:44 a.m., Abel Bordón Durán escribió:

Hola listeros

Acudo a ustedes una vez más con una duda, primero decirles que no se
programar casi nada, ahora bien tenía en mi server un script que se
encargaba de descargarme el pdf del Granma y el juventud para ponerlo al
servicio de mi red y así liberar ancho de banda pero resulta que desde que
Granma cambió su portada también cambio la url de descarga del Granma que
pone de nombre en el fichero de descarga la fecha + la cantidad de páginas
que tiene, lo de la fecha era fácil pues antes estaba así y lo había
resuelto utilizando una variable pero ahora no sé cómo ponerle el # de
páginas ya que no siempre es constante, entonces mi gran pregunta es cómo
hacerlo alguien tiene el mismo servicio montado o sabe cómo hacerlo??

Gracias una vez más



Abel Bordón Durán

Administrador de Red

Facultad de Ciencias Agropecuarias

Universidad de Ciego de Ávila

jabber:  abor...@jabber.unica.cu
telf. 225702 ext. 1054




Participe en el Evento Internacional UNICA 2014, del 14 al 16 de octubre del 
2014. Ciego de �vila, Cuba




--
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l

[Gutl-l] OT: Descargar el pdf del granma

2014-03-21 Por tema Abel Bordón Durán
Hola listeros

Acudo a ustedes una vez más con una duda, primero decirles que no se
programar casi nada, ahora bien tenía en mi server un script que se
encargaba de descargarme el pdf del Granma y el juventud para ponerlo al
servicio de mi red y así liberar ancho de banda pero resulta que desde que
Granma cambió su portada también cambio la url de descarga del Granma que
pone de nombre en el fichero de descarga la fecha + la cantidad de páginas
que tiene, lo de la fecha era fácil pues antes estaba así y lo había
resuelto utilizando una variable pero ahora no sé cómo ponerle el # de
páginas ya que no siempre es constante, entonces mi gran pregunta es cómo
hacerlo alguien tiene el mismo servicio montado o sabe cómo hacerlo??

Gracias una vez más

 

Abel Bordón Durán

Administrador de Red

Facultad de Ciencias Agropecuarias

Universidad de Ciego de Ávila

jabber:   abor...@jabber.unica.cu 
telf. 225702 ext. 1054

 


Participe en el Evento Internacional UNICA 2014, del 14 al 16 de octubre del 
2014. Ciego de Ávila, Cuba

-- 
Este mensaje ha sido analizado por MailScanner
en busca de virus y otros contenidos peligrosos,
y se considera que está limpio.

 próxima parte 
Se ha borrado un adjunto en formato HTML...
URL: 

__
Lista de correos del Grupo de Usuarios de Tecnologías Libres de Cuba.
Gutl-l@jovenclub.cu
https://listas.jovenclub.cu/cgi-bin/mailman/listinfo/gutl-l