Re: [R-es] Tibble o data.table?

2017-11-22 Thread Carlos Ortega
Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
queda otra opción que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que
ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer
compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
mismo "sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tibble o data.table?

2017-11-22 Thread Freddy Omar López Quintero
El mié, 22-11-2017 a las 20:51 +, Jesús Para Fernández escribió:
> Me parece que queda mas limpio, pero no se porque no le pillo la
> gracia

No estás solo en el mundo: si bien muchas cosas facilitan la vida
utilizando elementos de tidyverse, en su conjunto, yo no lo compro,
tampoco. Son como un dialecto en el idioma R.
¡Salud!


-- 
«...homines autem hominum causa esse generatos...»

Cicero
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tibble o data.table?

2017-11-22 Thread José Luis Cañadas
Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la
conexión a fuentes externas , como postgres,spark, presto y usar dplyr como
front.


El mié., 22 nov. 2017 21:51, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Tienes razon de que hay una serie de paquetes que lo usan, pero me da que
> vienen impulsados por Rstudio desde el paquete tidyverse...
>
> Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque
> no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para
> atras...
> 
> De: Carlos Ortega 
> Enviado: miércoles, 22 de noviembre de 2017 21:29
> Para: Jesús Para Fernández
> Cc: r-help-es@r-project.org
> Asunto: Re: [R-es] Tibble o data.table?
>
> Hola,
>
> Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
> queda otra opción que usar los tibbles.
>
> La sintaxis de data.table es un tanto compleja frente a la sencillez que
> ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
> diferencia en rendimiento.
> Por otro lado, son cada vez más los paquetes que se quieren hacer
> compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
> mismo "sparklyr").
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es<
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
> j.para.fernan...@hotmail.com>
> escribió:
> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es<
> https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0
> >
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es<
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tibble o data.table?

2017-11-22 Thread Jesús Para Fernández
Que es postgres y presto?? Se uqe google tiene la respuesta,

De: Jos� Luis Ca�adas 
Enviado: mi�rcoles, 22 de noviembre de 2017 22:01
Para: Jes�s Para Fern�ndez
Cc: Carlos Ortega; r-help-es@r-project.org
Asunto: Re: [R-es] Tibble o data.table?


Yo la ventaja que le veo a tibble y dem�s cosas del mundo tidy es la conexi�n a 
fuentes externas , como postgres,spark, presto y usar dplyr como front.

El mi�., 22 nov. 2017 21:51, Jes�s Para Fern�ndez 
mailto:j.para.fernan...@hotmail.com>> escribi�:
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que 
vienen impulsados por Rstudio desde el paquete tidyverse...

Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le 
pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...

De: Carlos Ortega mailto:c...@qualityexcellence.es>>
Enviado: mi�rcoles, 22 de noviembre de 2017 21:29
Para: Jes�s Para Fern�ndez
Cc: r-help-es@r-project.org
Asunto: Re: [R-es] Tibble o data.table?

Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda 
otra opci�n que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece 
el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en 
rendimiento.
Por otro lado, son cada vez m�s los paquetes que se quieren hacer compatibles 
con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo 
"sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 22 de noviembre de 2017, 10:39, Jes�s Para Fern�ndez 
mailto:j.para.fernan...@hotmail.com>>>
 escribi�:
Buenas

Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, 
ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto 
prefiero usar data.table. Me parece igual de potente y mucho m�s r�pido, y no 
le veo las supuestas ventajas, pero quiero conocer vuestra opinion.

Gracias
Jes�s

[[alternative HTML version deleted]]


___
R-help-es mailing list
R-help-es@r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es



--
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-proj

Re: [R-es] Tibble o data.table?

2017-11-22 Thread José Luis Cañadas
Te pongo enlace de Presto. De postgress hay muchas referencias.
https://aws.amazon.com/es/emr/details/presto/

Y para Presto existe Rpresto, que permite usar DBI sobre Presto.
Básicamente, permite ver tablas hive en R y hacer sql muy rápidas sobre
grandes volúmenes de datos, sin tener que levantar un spark.

El mié., 22 nov. 2017 22:07, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Que es postgres y presto?? Se uqe google tiene la respuesta,
> --
> *De:* José Luis Cañadas 
> *Enviado:* miércoles, 22 de noviembre de 2017 22:01
> *Para:* Jesús Para Fernández
> *Cc:* Carlos Ortega; r-help-es@r-project.org
>
> *Asunto:* Re: [R-es] Tibble o data.table?
>
> Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la
> conexión a fuentes externas , como postgres,spark, presto y usar dplyr como
> front.
>
>
> El mié., 22 nov. 2017 21:51, Jesús Para Fernández <
> j.para.fernan...@hotmail.com> escribió:
>
> Tienes razon de que hay una serie de paquetes que lo usan, pero me da que
> vienen impulsados por Rstudio desde el paquete tidyverse...
>
> Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque
> no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para
> atras...
> 
> De: Carlos Ortega 
> Enviado: miércoles, 22 de noviembre de 2017 21:29
> Para: Jesús Para Fernández
> Cc: r-help-es@r-project.org
> Asunto: Re: [R-es] Tibble o data.table?
>
> Hola,
>
> Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
> queda otra opción que usar los tibbles.
>
> La sintaxis de data.table es un tanto compleja frente a la sencillez que
> ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
> diferencia en rendimiento.
> Por otro lado, son cada vez más los paquetes que se quieren hacer
> compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
> mismo "sparklyr").
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
> 
> <
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
> j.para.fernan...@hotmail.com>
> escribió:
> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> 
> <
> https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0
> >
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
> 
> <
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> 

Re: [R-es] Tibble o data.table?

2017-11-22 Thread Jesús Para Fernández
Muchisimas gracias 😊



De: José Luis Cañadas 
Enviado: miércoles, 22 de noviembre de 2017 22:23
Para: Jesús Para Fernández
Cc: Carlos Ortega; r-help-es@r-project.org
Asunto: Re: [R-es] Tibble o data.table?


Te pongo enlace de Presto. De postgress hay muchas referencias.
https://aws.amazon.com/es/emr/details/presto/

Y para Presto existe Rpresto, que permite usar DBI sobre Presto. Básicamente, 
permite ver tablas hive en R y hacer sql muy rápidas sobre grandes volúmenes de 
datos, sin tener que levantar un spark.

El mié., 22 nov. 2017 22:07, Jesús Para Fernández 
mailto:j.para.fernan...@hotmail.com>> escribió:
Que es postgres y presto?? Se uqe google tiene la respuesta,

De: José Luis Cañadas mailto:canadasre...@gmail.com>>
Enviado: miércoles, 22 de noviembre de 2017 22:01
Para: Jesús Para Fernández
Cc: Carlos Ortega; r-help-es@r-project.org

Asunto: Re: [R-es] Tibble o data.table?

Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a 
fuentes externas , como postgres,spark, presto y usar dplyr como front.

El mié., 22 nov. 2017 21:51, Jesús Para Fernández 
mailto:j.para.fernan...@hotmail.com>> escribió:
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que 
vienen impulsados por Rstudio desde el paquete tidyverse...

Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le 
pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...

De: Carlos Ortega mailto:c...@qualityexcellence.es>>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-es@r-project.org
Asunto: Re: [R-es] Tibble o data.table?

Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda 
otra opción que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece 
el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en 
rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer compatibles 
con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo 
"sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 22 de noviembre de 2017, 10:39, Jesús Para Fernández 
mailto:j.para.fernan...@hotmail.com>>>
 escribió:
Buenas

Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, 
ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto 
prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no 
le veo las supuestas ventajas, pero quiero conocer vuestra opinion.

Gracias
Jesús

[[alternative HTML version deleted]]


___
R-help-es mailing list
R-help-es@r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es



--
Saludos,
Carlos Ortega
www.qualityexcellence.es

Re: [R-es] Tibble o data.table?

2017-11-22 Thread Carlos Ortega
PostgresSQL (es una base de datos relacional opensource)
Y Presto es un motor de base de datos distribuida que se entiende con Hive,
Cassandra, etc..

Vaya, lo que quería aportar es otra idea.
Leía hace poco en este blog:

http://winvector.github.io/FluidData/DataWranglingAtScale.html

*"R its is packages"*

Que me parece una de las mejores definiciones a la tradicional de "entorno
y lenguaje para análisis de datos"...
data.table es en sí otro "lenguaje" dentro de "R", su creador ahora está en
H2O que también lo han integrado en la lectura de ficheros.

No veo mucho problema en que RStudio apoye todo el "tidyverse", casi al
contrario es una forma de garantizar consistencia entre toda su sintaxis
con la que puedes hacer gran parte de las actividades que requiere un
proceso de análisis. Y esto que con "dplyr" puedas conectarte a casi
cualquier fuente de datos (ahora tiene conectores empresariales para las
bases de datos BigData: Hive, Impala, ...) es una gran ventaja. O todo lo
que están haciendo con "sparklyr", o más recientemente con "keras" y
"tensorflow". Y con el fichaje de Max Kuhn, y su paquete "recipes", "caret"
también formará parte del ecosistema "tidy".


Saludos,
Carlos Ortega
www.qualityexcellence.es


El 22 de noviembre de 2017, 22:07, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Que es postgres y presto?? Se uqe google tiene la respuesta,
> --
> *De:* José Luis Cañadas 
> *Enviado:* miércoles, 22 de noviembre de 2017 22:01
> *Para:* Jesús Para Fernández
> *Cc:* Carlos Ortega; r-help-es@r-project.org
>
> *Asunto:* Re: [R-es] Tibble o data.table?
>
>
> Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la
> conexión a fuentes externas , como postgres,spark, presto y usar dplyr como
> front.
>
>
> El mié., 22 nov. 2017 21:51, Jesús Para Fernández <
> j.para.fernan...@hotmail.com> escribió:
>
> Tienes razon de que hay una serie de paquetes que lo usan, pero me da que
> vienen impulsados por Rstudio desde el paquete tidyverse...
>
> Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque
> no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para
> atras...
> 
> De: Carlos Ortega 
> Enviado: miércoles, 22 de noviembre de 2017 21:29
> Para: Jesús Para Fernández
> Cc: r-help-es@r-project.org
> Asunto: Re: [R-es] Tibble o data.table?
>
> Hola,
>
> Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
> queda otra opción que usar los tibbles.
>
> La sintaxis de data.table es un tanto compleja frente a la sencillez que
> ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
> diferencia en rendimiento.
> Por otro lado, son cada vez más los paquetes que se quieren hacer
> compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
> mismo "sparklyr").
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
> 
>  2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%
> 7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435
> %7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%
> 2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
>
> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
> j.para.fernan...@hotmail.com>
> escribió:
> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> 
>  2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=
> 02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7
> b193%7C84df9e7fe9f640afb435%7C1%7C0%
> 7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKS
> v89psbhpA489A%3D&reserved=0>
>
>
>
> --
> Saludos,
> Carlos Orteg