Re: [R-es] Es todo python

2017-11-11 Por tema Freddy Omar López Quintero

> El 11-11-2017, a las 08:51, Jesús Para Fernández 
>  escribió:
> 
> Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con 'estupor' 
> que practicamente la gente trabaja con python.
> 
> Es cierto que la mayor parte de competiciones son usadas con redes 
> neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver 
> como python para temas de machine learning parece estar ganando la partida...

¿Qué es «machine learning», qué es la estadística?¿Qué es python, qué es R?

Yo creo que R fue concebido como un software para cómputo estadístico, con un 
poderoso motor gráfico. Sería raro que en un concurso estadístico, R no 
resultara victorioso. Los estadísticos somos su audiencia por excelencia, pero 
ahora hablan de ciencia de datos, que me parece aún un término un poquín difuso.

python es un software de propósito general, popular entre computistas, 
informáticos, ingenieros y, como no, algunos estadísticos. No me alarma que, en 
grupos multidisciplinarios, un programa de propósito general resulte más útil 
que uno cuyo objetivo es particular.

En mi percepción, la mayoría de las personas que participan en kaggle y 
similares, no son estadísticos de formación (cuestión que no invalida nada, por 
si acaso) y por eso no han estado tan expuestos a R y utilizan otras 
herramientas de mayor visibilidad, como python. Quién sabe cuánta razón tendré, 
pero no quiero ni pensar en el porcentaje que utilizan otros excelentes 
programas estadísticos, como stata o el mismísimo SAS, en este tipo de 
escenarios.

En el mundo real, alejados de competiciones y ejercicios académicos, python 
funciona mejor para aglutinar los resultados que se van obteniendo en las 
distintas áreas. Esa ha sido mi experiencia.

¡Salud!
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Fwd: Es todo python

2017-11-11 Por tema José Luis Cañadas
-- Forwarded message -
From: José Luis Cañadas 
Date: sáb., 11 nov. 2017 21:16
Subject: Re: [R-es] Es todo python
To: Francisco Rodríguez 


Cierto.
Hay mucho Python por ahí fuera, ¿Y qué? Es software libre igual que R y
funciona bien.  También es cierto que R da más detalle de salida y más
funcionalidades de cara a entender un modelo, por ejemplo para diagnosis de
los residuos.

Dicen que en esta era del bigdata, Python (y pyspark) es el futuro, pero yo
no lo he hecho de menos teniendo R, sparkr, sparklyr y H2O y el gran
repositorio de GitHub cloudyr para, por ejemplo, conectar R con googlecloud
o los servicios de Amazon web services como Alexa o leer y escribir datos
de S3

También comentan que en entornos de producción Python es mejor, la verdad
que creo que R también puede competir ahi, utilizando librerías como
opencpu, shiny o el ultra fácil plumber para hacer un API REST. Creo que
hay mucho desconocimiento de herramientas de R para ponerlo en entornos
productivos..

Como nota diré que R y particularmente los paquetes FactomineR y factoextra
me han salvado la vida un par de veces cuando tenía datos con variables
categóricas y tenía que hacer clustering u otras cosas raras de esas que
piden los clientes. Muchas de estas técnicas no están implementadas en
Python ni en spark, aunque sería fácil, solo es transformar un poco la
matriz de datos antes de aplicar una descomposición en valores singulares.

Lo dicho, a mí me gustan ambos lenguajes, aunque encuentro más sencillo R.
Y para los que quieran usar cosas de Python dentro de R el paquete
reticulate es fabuloso. Para temas de deeplearnig existe  tensorflow y
keras para R, sin olvidarnos del magnífico MxNet (de los chicos de xgboost)

Un saludo y no olvidéis que el próximo jueves empiezan las jornadas de R
hispano en Granada

El sáb., 11 nov. 2017 16:16, Francisco Rodríguez 
escribió:

> Lo de la multiplicidad de soluciones es algo interesante y de lo que más
> me gusta en R. A veces python resulta muy encasillado y no da la
> flexibilidad suficiente.
>
>
> Es cierto que entre muchas soluciones una es mejor que otra, pero en
> general cuando se empieza por R fácilmente se suele llegar a una solución
> (por lo menos se llega a una) y si se avanza y si le merece la pena, uno
> puede profundizar más.
>
>
> Debo admitir que la empresa privada, por causa en general de gente no
> estadística que primero aprendieron python están apostando más por esta
> tecnología que no está exenta de problema y que tiene sus fortalezas.
>
>
> Pero 2 puntos en los que yo, personal destaco a R sobre python es el
> entorno de desarrollo RStudio donde lo más parecido en Python (que yo
> conozca) es el PyCharm que se acerca pero no llega, y el entorno de
> desarrollo Shiny, que permite rápidamente montar una web sin conocer mucho
> de otras tecnologías donde lo más parecido en Python es el Flask que aunque
> da aspectos bastante amigables (en ocasiones mejores que el shiny) es mucho
> menos trivial en su uso.
>
>
> Otro punto que se ha destacado es que un lenguaje para Estadísticos (nota,
> no me gusta dividir el mundo entre data scientist y data ingeneers, es como
> si ahora hubieran desaparecido los estadísticos y los informáticos) esto
> tiene lo bueno de que los métodos en R ofrecen en general más riqueza de
> salida que los de python pero si no hay una mano "informática" por detrás,
> veo difícil que pueda retomar algunas batallas con éxito frente al mundo
> python como el tema deep learning y este punto es crucial si R quiere estar
> a la altura en un futuro.
>
>
> Un saludo
>
>
> 
> De: R-help-es  en nombre de Javier
> Marcuzzi 
> Enviado: sábado, 11 de noviembre de 2017 13:44
> Para: Jesús Para Fernández
> Cc: r-help-es@r-project.org
> Asunto: Re: [R-es] Es todo python
>
> Estimados
>
> Antes de R, intenté algunas cosas con python, hablemos de más de 15 a anos
> (no me sale la letra en espannniiiol), yo estaba con le jefe de cátedra de
> genética y mejoramiento animal haciendo cosas con fortran y me pareció
> mucho más simple, luego encontré R y fue este para muchas cosas. Hace una
> semana o dos vi algo porque lo tiene visual studio y un conocido lo usa y
> le encanta. Leí sobre modelos mixtos, ellos incluso realizan referencia a
> la documentación de R, es algo de costumbre, pero profundizando los
> algoritmos de R tienen funcionalidades para los análisis que ellos no
> disponen, por otro lado me gustó la forma de colocar cosas, en otras
> palabras, si uno quiere conectar R con C# el R.dotnet hace que se yo cuánto
> no se actualiza y hoy no lo puedo hacer andar, estaría el sqlserver o
> rserver, ellos creo que tienen más simple el colocar en un servidor (es mi
> impresión), y otro punto a favor de ellos es la posibilidad de editar
> código de distintas cosas, algo de lenguaje humano con