Re: [R-es] Tasa variación diaria COVID-19

2020-03-25 Por tema Javier Gómez Gonzalez
Los datos del COVID-19 por comunidades los puedes obtener en esta dirección
https://www.mscbs.gob.es/profesionales/saludPublica/ccayes/alertasActual/nCov-China/situacionActual.htm
En el apartado que pone actualización nº 53: enfermedad
SARS-COV-2(COVID-19) 23-03-2020.
Al pinchar el enlace solo puedes descargar el pdf correspondiente al día
23-03-2020. Para obtener los anteriores cambian en la barra de direcciones
el número de la actualización y así puedes descargar las más antiguas, pero
no todas. las que te falten prueba a buscar en google.

Los datos por países los puedes descargar del
European Centre for Disease Prevention and Control
https://www.ecdc.europa.eu/en/publications-data/download-todays-data-geographic-distribution-covid-19-cases-worldwide


El lun., 23 mar. 2020 a las 10:29, Juan Abasolo ()
escribió:

> Buenas y ascépticas!
> Capaz que sea demasiado disgregante, pero creo que a alguno le puede
> interesar. En el usuario de R-Blogers de Twitter estos días estan
> presentando hasta paquetes para tratar los temas del corina...
>
> No ando yo en eso, pero creo que les puede interesar, si no andan
> aplastados con tele-urgencias.
>
> Yo sí, simple pero mucho.
>
> Cuidense y a los cercanos y lejanos,
>
> Juan
>
> Hau idatzi du Javier Gómez Gonzalez (zaraga...@gmail.com) erabiltzaileak
> (2020 mar. 23, al. (03:13)):
>
>>  Muchas gracias a todos por su ayuda.
>>
>> Hace un rato antes de abrir el correo, he encontrado dos soluciones a mi
>> problema de como calcular el porcentaje de variación.
>> La primera es usando el paquete dplyr:
>>
>> https://stackoverflow.com/questions/48196552/calculate-percentage-change-in-r-using-dplyr/48196871
>>
>> La segunda usando la función PercChange del paquete DataCombine
>> https://rdrr.io/cran/DataCombine/man/PercChange.html
>>
>>
>> El dom., 22 mar. 2020 a las 23:51, Carlos Ortega (<
>> c...@qualityexcellence.es>)
>> escribió:
>>
>> > Hola,
>> >
>> > Te sale error porque has cargado el fichero con read.csv().
>> > Si pruebas a cargarlo con "fread()" tus datos tendrán clase data.table.
>> > El error que obtienes es porque el objeto df (igual que datos) no es un
>> > data.table.
>> >
>> > Saludos,
>> > Carlos Ortega
>> > www.qualityexcellence.es
>> >
>> > El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
>> > javier.ruben.marcu...@gmail.com>) escribió:
>> >
>> > > Eric
>> > >
>> > > ¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
>> > > errores. Copio y pego todo como me sale en la consola.
>> > >
>> > > > #
>> > >
>> > >
>> >
>> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
>> > > > datos <-
>> > > read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
>> > > >
>> > > > library(data.table)
>> > > > library(ggplot2)
>> > > > library(anytime)
>> > > >
>> > > > df <-datos
>> > > >
>> > > > df[, fec:=anytime(fec)]
>> > > Error in `:=`(fec, anytime(fec)) :
>> > >   Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...)
>> are
>> > > defined for use in j, once only and in particular ways. See
>> help(":=").
>> > > > setkey(df,com,fec)
>> > > Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
>> > >   x is not a data.table
>> > > >
>> > > > # newc: son los nuevos casos
>> > > > df[, newc:=ct - shift(ct), by=.(com)]
>> > > Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by =
>> .(com)) :
>> > >   unused argument (by = .(com))
>> > > >
>> > > > # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
>> > > >
>> > > > df[, tasa:=newc/ct, by=.(com)]
>> > > Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
>> > >   unused argument (by = .(com))
>> > >
>> > > El dom., 22 mar. 2020 a las 16:52, neo ()
>> > > escribió:
>> > >
>> > > > Hola Javier, yo lo hice de la siguiente forma:
>> > > >
>> > > > library(data.table)
>> > > > library(ggplot2)
>> > > > library(anytime)
>> > > >
>> > > > df <- fread("/home/neo/Desktop/rhelp/spain.csv")
>> > > > df[, fec:=anytime(fec)]
>> > > > setkey(df,com,fec)
>> > > >
>> > > >  # newc: son los nuevos casos
>> > > > df[, newc:=ct - shift(ct), by=.(com)]
>> > > >
>> > > >  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
>> > > >
>> > > > df[, tasa:=newc/ct, by=.(com)]
>> > > >
>> > > >
>> > > > y obtuve lo siguiente:
>> > > >
>> > > >
>> > > > fec   com pob ct newc tasa
>> > > > 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
>> > > > 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
>> > > > 3: 2020-06-02 23:00:00 Andalucía 8414240 219 0.42857143
>> > > > 4: 2020-04-02 23:00:00Aragón 1319291  0 NA  NA
>> > > > 5: 2020-05-02 23:00:00Aragón 1319291  11 1.
>> > > > 6: 2020-06-02 23:00:00Aragón 1319291  65 0.8333
>> > > > 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
>> > > > 8: 2020-05-02 23:00:00  Asturias 1022800  53 0.6000
>> > > > 9: 2020-06-02 23:00:00  Asturias 1

Re: [R-es] Tasa variación diaria COVID-19

2020-03-25 Por tema Javier Marcuzzi
Estimados

Otra fuente es https://github.com/CSSEGISandData/COVID-19 , en github hay
varios escritos con datos, códigos, reportes, para ser sincero, mire cuatro
o cinco, todos semejantes, contar muertos, vivos, algunos predicen, pero
estoy cansado de científicos que analizando datos decían por donde iría el
virus, y el virus no les hace caso, por suerte la televisión en Argentina
ya no los pasa más. Lo que sí ve como interesante en github es uno que
propone analizar radiografías pulmonares, y en lo particular como
profesional del arte de curar creo que sería bueno con redes buscar puntos
que no son tenidos en cuenta, para que los profesionales de la salud sepan
por ejemplo, en x, y hay esto que se pondera en 0,5 y no tenemos ni idea
que es, hay que buscarlo, investigarlo, etc.

Javier Rubén Marcuzzi

El mié., 25 mar. 2020 a las 8:46, Jorge Pradas ()
escribió:

> Hola,
> Aqui tenéis un dataset completo que actualizan todos los días con datos de
> provincias de todo el mundo. hay además varios proyectos que se llevan en
> marcha para explotar los datos.
> https://www.kaggle.com/imdevskp/corona-virus-report
>
> y aqui muchos más datos sobre todo de España y muchas aplicaciones hechas
> ya sobre esos datos.
> https://github.com/datadista/datasets/tree/master/COVID%2019
>
>
> El mié., 25 mar. 2020 a las 9:55, Manuel Mendoza (<
> mmend...@fulbrightmail.org>) escribió:
>
> > Gracias Ruben, muy interesante. Algo así estuve buscando, por ciudades y
> a
> > nivel internacional, pero no lo encontré. Me bastaría con el número de
> > fallecimientos por día, de cuantas más ciudades del mundo mejor. Si
> alguno
> > supiera de algo así, le agradecería que me lo comunicase.
> > Un saludo,
> > Manuel
> >
> > El mar., 24 mar. 2020 a las 21:04, Rubén Fernández Casal (<
> > rubenfca...@gmail.com>) escribió:
> >
> > > Hola a todos,
> > >
> > > Aprovecho para comentaros que estuve preparando un repositorio en
> GitHub
> > (
> > > https://github.com/rubenfcasal/COVID-19) para facilitar el acceso a
> los
> > > datos oficiales del COVID-19 por CCAA. Principalmente para los que
> pueden
> > > estar interesados en analizarlos empleando R (web:
> > > https://rubenfcasal.github.io/COVID-19), pero también puede ser de
> > > utilidad
> > > simplemente para consultarlos (tablas:
> > > https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html).
> > >
> > > Gracias a vuestros mensajes pude descargarme un fichero pdf que me
> > faltaba
> > > y también me animé a ponerlo en github por si puede resultar de
> > interés...
> > >
> > > Un saludo, Rubén.
> > >
> > > El lun., 23 mar. 2020 a las 3:13, Javier Gómez Gonzalez (<
> > > zaraga...@gmail.com>) escribió:
> > >
> > > >  Muchas gracias a todos por su ayuda.
> > > >
> > > > Hace un rato antes de abrir el correo, he encontrado dos soluciones a
> > mi
> > > > problema de como calcular el porcentaje de variación.
> > > > La primera es usando el paquete dplyr:
> > > >
> > > >
> > >
> >
> https://stackoverflow.com/questions/48196552/calculate-percentage-change-in-r-using-dplyr/48196871
> > > >
> > > > La segunda usando la función PercChange del paquete DataCombine
> > > > https://rdrr.io/cran/DataCombine/man/PercChange.html
> > > >
> > > >
> > > > El dom., 22 mar. 2020 a las 23:51, Carlos Ortega (<
> > > > c...@qualityexcellence.es>)
> > > > escribió:
> > > >
> > > > > Hola,
> > > > >
> > > > > Te sale error porque has cargado el fichero con read.csv().
> > > > > Si pruebas a cargarlo con "fread()" tus datos tendrán clase
> > data.table.
> > > > > El error que obtienes es porque el objeto df (igual que datos) no
> es
> > un
> > > > > data.table.
> > > > >
> > > > > Saludos,
> > > > > Carlos Ortega
> > > > > www.qualityexcellence.es
> > > > >
> > > > > El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
> > > > > javier.ruben.marcu...@gmail.com>) escribió:
> > > > >
> > > > > > Eric
> > > > > >
> > > > > > ¿Que dataset utilizo? Por curiosidad probé su código, pero me
> salen
> > > > > > errores. Copio y pego todo como me sale en la consola.
> > > > > >
> > > > > > > #
> > > > > >
> > > > > >
> > > > >
> > > >
> > >
> >
> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> > > > > > > datos <-
> > > > > >
> read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
> > > > > > >
> > > > > > > library(data.table)
> > > > > > > library(ggplot2)
> > > > > > > library(anytime)
> > > > > > >
> > > > > > > df <-datos
> > > > > > >
> > > > > > > df[, fec:=anytime(fec)]
> > > > > > Error in `:=`(fec, anytime(fec)) :
> > > > > >   Check that is.data.table(DT) == TRUE. Otherwise, := and
> `:=`(...)
> > > are
> > > > > > defined for use in j, once only and in particular ways. See
> > > help(":=").
> > > > > > > setkey(df,com,fec)
> > > > > > Error in setkeyv(x, cols, verbose = verbose, physical =
> physical) :
> > > > > >   x is not a data.table
> > > > > > >
> > > > > > > # newc: son los nuevos casos
> > > > > > > df[, newc:=ct - shift(ct), by=.(com)

Re: [R-es] Tasa variación diaria COVID-19

2020-03-25 Por tema Jorge Pradas
Hola,
Aqui tenéis un dataset completo que actualizan todos los días con datos de
provincias de todo el mundo. hay además varios proyectos que se llevan en
marcha para explotar los datos.
https://www.kaggle.com/imdevskp/corona-virus-report

y aqui muchos más datos sobre todo de España y muchas aplicaciones hechas
ya sobre esos datos.
https://github.com/datadista/datasets/tree/master/COVID%2019


El mié., 25 mar. 2020 a las 9:55, Manuel Mendoza (<
mmend...@fulbrightmail.org>) escribió:

> Gracias Ruben, muy interesante. Algo así estuve buscando, por ciudades y a
> nivel internacional, pero no lo encontré. Me bastaría con el número de
> fallecimientos por día, de cuantas más ciudades del mundo mejor. Si alguno
> supiera de algo así, le agradecería que me lo comunicase.
> Un saludo,
> Manuel
>
> El mar., 24 mar. 2020 a las 21:04, Rubén Fernández Casal (<
> rubenfca...@gmail.com>) escribió:
>
> > Hola a todos,
> >
> > Aprovecho para comentaros que estuve preparando un repositorio en GitHub
> (
> > https://github.com/rubenfcasal/COVID-19) para facilitar el acceso a los
> > datos oficiales del COVID-19 por CCAA. Principalmente para los que pueden
> > estar interesados en analizarlos empleando R (web:
> > https://rubenfcasal.github.io/COVID-19), pero también puede ser de
> > utilidad
> > simplemente para consultarlos (tablas:
> > https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html).
> >
> > Gracias a vuestros mensajes pude descargarme un fichero pdf que me
> faltaba
> > y también me animé a ponerlo en github por si puede resultar de
> interés...
> >
> > Un saludo, Rubén.
> >
> > El lun., 23 mar. 2020 a las 3:13, Javier Gómez Gonzalez (<
> > zaraga...@gmail.com>) escribió:
> >
> > >  Muchas gracias a todos por su ayuda.
> > >
> > > Hace un rato antes de abrir el correo, he encontrado dos soluciones a
> mi
> > > problema de como calcular el porcentaje de variación.
> > > La primera es usando el paquete dplyr:
> > >
> > >
> >
> https://stackoverflow.com/questions/48196552/calculate-percentage-change-in-r-using-dplyr/48196871
> > >
> > > La segunda usando la función PercChange del paquete DataCombine
> > > https://rdrr.io/cran/DataCombine/man/PercChange.html
> > >
> > >
> > > El dom., 22 mar. 2020 a las 23:51, Carlos Ortega (<
> > > c...@qualityexcellence.es>)
> > > escribió:
> > >
> > > > Hola,
> > > >
> > > > Te sale error porque has cargado el fichero con read.csv().
> > > > Si pruebas a cargarlo con "fread()" tus datos tendrán clase
> data.table.
> > > > El error que obtienes es porque el objeto df (igual que datos) no es
> un
> > > > data.table.
> > > >
> > > > Saludos,
> > > > Carlos Ortega
> > > > www.qualityexcellence.es
> > > >
> > > > El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
> > > > javier.ruben.marcu...@gmail.com>) escribió:
> > > >
> > > > > Eric
> > > > >
> > > > > ¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
> > > > > errores. Copio y pego todo como me sale en la consola.
> > > > >
> > > > > > #
> > > > >
> > > > >
> > > >
> > >
> >
> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> > > > > > datos <-
> > > > > read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
> > > > > >
> > > > > > library(data.table)
> > > > > > library(ggplot2)
> > > > > > library(anytime)
> > > > > >
> > > > > > df <-datos
> > > > > >
> > > > > > df[, fec:=anytime(fec)]
> > > > > Error in `:=`(fec, anytime(fec)) :
> > > > >   Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...)
> > are
> > > > > defined for use in j, once only and in particular ways. See
> > help(":=").
> > > > > > setkey(df,com,fec)
> > > > > Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
> > > > >   x is not a data.table
> > > > > >
> > > > > > # newc: son los nuevos casos
> > > > > > df[, newc:=ct - shift(ct), by=.(com)]
> > > > > Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by =
> > .(com))
> > > :
> > > > >   unused argument (by = .(com))
> > > > > >
> > > > > > # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > > > > >
> > > > > > df[, tasa:=newc/ct, by=.(com)]
> > > > > Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
> > > > >   unused argument (by = .(com))
> > > > >
> > > > > El dom., 22 mar. 2020 a las 16:52, neo ( >)
> > > > > escribió:
> > > > >
> > > > > > Hola Javier, yo lo hice de la siguiente forma:
> > > > > >
> > > > > > library(data.table)
> > > > > > library(ggplot2)
> > > > > > library(anytime)
> > > > > >
> > > > > > df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> > > > > > df[, fec:=anytime(fec)]
> > > > > > setkey(df,com,fec)
> > > > > >
> > > > > >  # newc: son los nuevos casos
> > > > > > df[, newc:=ct - shift(ct), by=.(com)]
> > > > > >
> > > > > >  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > > > > >
> > > > > > df[, tasa:=newc/ct, by=.(com)]
> > > > > >
> > > > > >
> > > > > > y obtuve lo siguiente:
> > > > > >
> > > >

Re: [R-es] Tasa variación diaria COVID-19

2020-03-25 Por tema Manuel Mendoza
Gracias Ruben, muy interesante. Algo así estuve buscando, por ciudades y a
nivel internacional, pero no lo encontré. Me bastaría con el número de
fallecimientos por día, de cuantas más ciudades del mundo mejor. Si alguno
supiera de algo así, le agradecería que me lo comunicase.
Un saludo,
Manuel

El mar., 24 mar. 2020 a las 21:04, Rubén Fernández Casal (<
rubenfca...@gmail.com>) escribió:

> Hola a todos,
>
> Aprovecho para comentaros que estuve preparando un repositorio en GitHub (
> https://github.com/rubenfcasal/COVID-19) para facilitar el acceso a los
> datos oficiales del COVID-19 por CCAA. Principalmente para los que pueden
> estar interesados en analizarlos empleando R (web:
> https://rubenfcasal.github.io/COVID-19), pero también puede ser de
> utilidad
> simplemente para consultarlos (tablas:
> https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html).
>
> Gracias a vuestros mensajes pude descargarme un fichero pdf que me faltaba
> y también me animé a ponerlo en github por si puede resultar de interés...
>
> Un saludo, Rubén.
>
> El lun., 23 mar. 2020 a las 3:13, Javier Gómez Gonzalez (<
> zaraga...@gmail.com>) escribió:
>
> >  Muchas gracias a todos por su ayuda.
> >
> > Hace un rato antes de abrir el correo, he encontrado dos soluciones a mi
> > problema de como calcular el porcentaje de variación.
> > La primera es usando el paquete dplyr:
> >
> >
> https://stackoverflow.com/questions/48196552/calculate-percentage-change-in-r-using-dplyr/48196871
> >
> > La segunda usando la función PercChange del paquete DataCombine
> > https://rdrr.io/cran/DataCombine/man/PercChange.html
> >
> >
> > El dom., 22 mar. 2020 a las 23:51, Carlos Ortega (<
> > c...@qualityexcellence.es>)
> > escribió:
> >
> > > Hola,
> > >
> > > Te sale error porque has cargado el fichero con read.csv().
> > > Si pruebas a cargarlo con "fread()" tus datos tendrán clase data.table.
> > > El error que obtienes es porque el objeto df (igual que datos) no es un
> > > data.table.
> > >
> > > Saludos,
> > > Carlos Ortega
> > > www.qualityexcellence.es
> > >
> > > El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
> > > javier.ruben.marcu...@gmail.com>) escribió:
> > >
> > > > Eric
> > > >
> > > > ¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
> > > > errores. Copio y pego todo como me sale en la consola.
> > > >
> > > > > #
> > > >
> > > >
> > >
> >
> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> > > > > datos <-
> > > > read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
> > > > >
> > > > > library(data.table)
> > > > > library(ggplot2)
> > > > > library(anytime)
> > > > >
> > > > > df <-datos
> > > > >
> > > > > df[, fec:=anytime(fec)]
> > > > Error in `:=`(fec, anytime(fec)) :
> > > >   Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...)
> are
> > > > defined for use in j, once only and in particular ways. See
> help(":=").
> > > > > setkey(df,com,fec)
> > > > Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
> > > >   x is not a data.table
> > > > >
> > > > > # newc: son los nuevos casos
> > > > > df[, newc:=ct - shift(ct), by=.(com)]
> > > > Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by =
> .(com))
> > :
> > > >   unused argument (by = .(com))
> > > > >
> > > > > # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > > > >
> > > > > df[, tasa:=newc/ct, by=.(com)]
> > > > Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
> > > >   unused argument (by = .(com))
> > > >
> > > > El dom., 22 mar. 2020 a las 16:52, neo ()
> > > > escribió:
> > > >
> > > > > Hola Javier, yo lo hice de la siguiente forma:
> > > > >
> > > > > library(data.table)
> > > > > library(ggplot2)
> > > > > library(anytime)
> > > > >
> > > > > df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> > > > > df[, fec:=anytime(fec)]
> > > > > setkey(df,com,fec)
> > > > >
> > > > >  # newc: son los nuevos casos
> > > > > df[, newc:=ct - shift(ct), by=.(com)]
> > > > >
> > > > >  # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > > > >
> > > > > df[, tasa:=newc/ct, by=.(com)]
> > > > >
> > > > >
> > > > > y obtuve lo siguiente:
> > > > >
> > > > >
> > > > > fec   com pob ct newc tasa
> > > > > 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA  NA
> > > > > 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.0833
> > > > > 3: 2020-06-02 23:00:00 Andalucía 8414240 219 0.42857143
> > > > > 4: 2020-04-02 23:00:00Aragón 1319291  0 NA  NA
> > > > > 5: 2020-05-02 23:00:00Aragón 1319291  11 1.
> > > > > 6: 2020-06-02 23:00:00Aragón 1319291  65 0.8333
> > > > > 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA  NA
> > > > > 8: 2020-05-02 23:00:00  Asturias 1022800  53 0.6000
> > > > > 9: 2020-06-02 23:00:00  Asturias 1022800  50 0.
> > > > >
> > > > > Espero que te sirva.
> > > > >
> > > > > S