[R-es] ¿Es "R" recomendable como lenguaje para alguien que quiere empezar a programar?....

2016-04-21 Thread Patricio Fuenmayor Viteri
Hola con todos...En mi experiencia, empec� en el mundo de la programaci�n con 
mi calculadora cient�fica HP48GX con sys rpl, luego pascal, luego visual basic 
for applications, c++, SQL, SAS, ..., hasta llegar a RYo pienso que depende 
para que se quiere programar???... obviamente carreras t�cnicas necesitan 
lenguajes de alto nivel como c++, fortran, etc. si se quiere desarrollar 
aplicaciones num�ricas y/o cient�ficas..En mi experiencia laboral (entidad 
financiera), el 70% de la gente que maneja datos usa Excel como �nica 
herramienta ... a ellos yo si les recomendar�a usar R como reemplazo de Excel 
en temas de procesamiento de informaci�n, y excel deber�a pasar a ser una 
herramienta de visualizaci�n y manipulaci�n sencilla de la informaci�n.El 20% 
ya tiene conocimiento de bases de datos y usa ya sea Access o Sqlserver ... a 
ellos R ser�a igual una herramienta complementaria para el tratamiento e 
interacci�n de an�lisis y de resultados con bases de datos.El 10% usa 
herramientas espec�ficas para manejo y an�lisis de informaci�n, de igual forma 
R ser�a un reemplazo o un complemento... Con esto quiero hacer notar, ... que 
los conceptos b�sicos que conlleva el aprendizaje de la programaci�n, R los 
puede suplir ... pero como les comento, programar para que ??? ... si una vez 
que entienden el uso y beneficio de todo lo desarrollado ya en R y que est� 
disponible en toda la gama de paquetes ... la programaci�n pasa a segundo 
plano, sin descartar que puedan hacer modificaciones y optimizaciones a los 
desarrollos ya hechos... Conozco "programadores" que hacen pergaminos de 
c�digo, tan extensos que el mantenimiento es imposible... he tenido que rehacer 
los mismos y con conceptualizaciones gen�ricas, logr� reducir en un 70 por 
ciento las lineas de c�digo y crear funciones din�micas param�tricas... mucho 
m�s �tiles y entendibles.Recuerdo el caso de una compa�era que le pidieron 
programar la mediana... se hab�a pasado son su hermano toda la noche haciendo 
el c�digo en SQL ... casi le d�o algo cuando le mostr� que existe una funci�n 
ya programada para eso...Creo que R es como un mega Lego (juego para armar), 
depende de la creatividad e inter�s del usuario en saber mas y lograr hacer 
desarrollos "elegantes" y funcionales.Y pienso que es fundamental entender que 
R usa la filosof�a: "investiga, y si no est� hecho, hazlo tu mismo"...!!! (no 
todas las personas pueden con esto) 
Saludos.
  
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[R-es] php-R

2015-08-05 Thread Patricio Fuenmayor Viteri
Hola...Otra forma y mas robusta.. pienso yo, es usar PL/R 
http://www.joeconway.com/plr/de esta forma llamas a procedimientos almacenados 
en postgres y entiendo yo que es mas f�cil la interacci�n entre php y 
postgres.Es una idea, y de paso ganas mucho en la administraci�n de datos 
Patricio.
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Operaciones entre conjuntos

2015-07-15 Thread Patricio Fuenmayor Viteri
Hola a todos...Estoy tratando de hacer un trabajo de comparacion de conjuntos y 
no entiendo que pasa con los resultados.Me explico. Tengo una columna donde se 
tiene el nombre de una persona, est� ordenado APELLIDOS - NOMBRESa continuaci�n 
tengo el el nombre de la misma persona, pero ordenado NOMBRES - APELLIDOS.El 
proceso debe identificar que las 2 columnas son iguales. Estoy usando 
operaciones entre conjuntos y estructuras data.tableNo entiendo, porque 
haciendo en data.table la comparacion me sale FALSA, es decir no son iguales, 
pero si hago la comparaci�n aparte, sale VERDADEROAdjunto el c�digo... gracias 
por su apoyo...
require(data.table)a - data.table(  x = 1:2,  y = 
list(c(ANDRES,GERARDO,CABRERA,GUAMAN),   
c(MONTALVAN,VERA,JORGE,LEONARDO)),  z = 
list(c(CABRERA,GUAMAN,GERARDO,ANDRES),   
c(JORGE,MONTALVAN,VERA)))
a[,:=(vld=setequal(y,z)),by=x]
setequal(c(ANDRES,GERARDO,CABRERA,GUAMAN),c(CABRERA,GUAMAN,GERARDO,ANDRES))
  
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] FW: error con cantidades grandes de datos

2015-06-20 Thread Patricio Fuenmayor Viteri
Saludos.Este momento estoy trabajando con bases de datos SQLSERVER, usando el 
paquete rsqlserver (github) la tabla a que consulto tiene alrededor de 
3millones de registros que tengo que trabajar. Cuando ejecuto la primera vez... 
sale este errorError: Value of SET_STRING_ELT() must be a 'CHARSXP' not a 
'character'lo extra�o es que lo vuelvo a ejecutar ... y ya no da el error.Otro 
tema extra�o, es que si bajo solo una parte de la base (limit 100) no 
aparece el error.He le�do mucho sobre esto.. y de lo que entiendo es un tema de 
incompatibilidad de tipos de datos definidos en R en el c�digo C.Alguien se ha 
topado con esto ??? y lo importante ... como lo ha tratado o solucionado.Tengo 
que automatizar los procesos y esto va ha ser un l�o.Gracias por su ayuda.

  
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] error con cantidades grandes de datos

2015-06-19 Thread Patricio Fuenmayor Viteri
Saludos.Este momento estoy trabajando con bases de datos SQLSERVER, usando el 
paquete rsqlserver (github) la tabla a que consulto tiene alrededor de 
3millones de registros que tengo que trabajar. Cuando ejecuto la primera vez... 
sale este errorError: Value of SET_STRING_ELT() must be a 'CHARSXP' not a 
'character'lo extra�o es que lo vuelvo a ejecutar ... y ya no da el error.Otro 
tema extra�o, es que si bajo solo una parte de la base (limit 100) no 
aparece el error.He le�do mucho sobre esto.. y de lo que entiendo es un tema de 
incompatibilidad de tipos de datos definidos en R en el c�digo C.Alguien se ha 
topado con esto ??? y lo importante ... como lo ha tratado o solucionado.Tengo 
que automatizar los procesos y esto va ha ser un l�o.Gracias por su ayuda.
  
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] funciones en estructura data.table

2015-06-17 Thread Patricio Fuenmayor Viteri


-Mensaje original-

De: Patricio Fuenmayor Viteri patricio.fuenma...@outlook.com
Enviado: 17 de junio de 2015 6:37 PM
Para: r-help...@r-ptoject.org, patricio.fuenma...@outlook.com
Asunto: funciones en estructura data.table

hola...
luego de haber migrado la mayoria de mis procesos a data.table. aun me kedan 
ciertos detalles por afinar.. eate es un ejemplo de eso..
tengo una tabla de emails y necesito hacer un analisis de dominios... para 
separar el nombre de usuario el dominio uso la funcion str_split del paquete 
stringr... pero el resultado me queda en una sola columna y separada por una 
coma... mi pregunta es ... como puedo hacer ke los multiples resultados de una 
funcion ... se guarden en diferentes columnas de mi data.table
email01[,.(str_split(email))]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Muestreo de bases de datos

2015-05-05 Thread Patricio Fuenmayor Viteri

Bueno ... voy a compartirles mi experiencia en esto.Freddy, yo tuve la misma 
experiencia que su amigo, es mas, aun la sigo teniendo... y en resumen y sin 
alargar el cuento ... me quedo con R.Porque mi decisi�n... por varios temas:1. 
Rapidez. Uno debe saber que es lo que se quiere hacer y que necesita para eso. 
El uso adecuado de indices, hash, etc. que permitan y faciliten al sistema 
trabajar eficientemente. R en mas r�pido que SAS en temas de cruces de datos 
(yo uso data.table e indexaciones por hash).2. Generalizado, centralizado y 
normalizado. El uso del concepto de funciones con par�metros, y un solo esquema 
de lenguaje y la programaci�n orientada a objetos, hace que se faciliten los 
temas. Programar los procesos usando un flujo y reutilizando las funciones, 
permiten que a mas de que el proceso sea escalable, su mantenimiento y la 
incorporaci�n de nuevas funcionalidades, se implemente f�cilmente.3. SAS 
facilita la conexi�n con diferentes bases de datos (siempre y cuando se tenga 
licenciado el m�dulo). Es recomendable usar librer�as en R que est�n 
programadas utilizando conectores nativos, tales como RMySQL, RPostgres, y la 
nueva que estoy usando rsqlserver (en desarrollo en github), las cuales son muy 
r�pidas en tiempos de respuesta.4. Programaci�n modular e incorporaci�n de 
conceptos y tecnolog�as. Esto, en mi caso, lo desarroll� por experiencia. Poder 
generalizar un proceso de informaci�n, manejar un modelos de datos, para 
optimizar el almacenaje de los datos y de los resultados, hacen que los tiempo 
de respuesta hacia el usuario sean cada vez mejores.5. Toda la gama de 
funciones desarrolladas por la comunidad, y los estudios y an�lisis compartidos 
en blogs, libros, etc. permiten que la curva de aprendizaje y de desarrollo sea 
mas corta, ademas uno puede evidenciar y aprender de gente mas experimentada en 
temas de manejo de informaci�n y de aplicaciones estad�sticas.Bueno... esto es 
parte de mi experiencia... y no quiero cansarles mas ... un abrazo ... !!!



--Archivo adjunto de mensaje reenviado--
From: jluis.gils...@tasacionesh.com
To: r-help-es@r-project.org
Date: Tue, 5 May 2015 11:12:49 +
Subject: Re: [R-es] Muestreo de bases de datos

Hola
 
Desvi�ndome un poco de la cuesti�n que plantea Freddy, no estoy muy de acuerdo 
con lo que comenta acerca de que  ... R no est� dise�ado (operaciones en la 
base de datos)...
 
Precisamente la mayor parte de mi trabajo en R se realiza vinculadolo a un 
servidor Microsoft SQL Server y lo cierto es que, hasta ahora, se entienden 
muy bien entre ellos.
Cierto es que, en mi caso, la mayor parte del flujo de datos (con millones de 
registros como norma general) va de R hacia el SQL, puesto que utilizo R para 
descargar los datos, organizarlos  y depurarlos antes de subirlos al SQL server.
 Al principio me inquietaba mucho el tiempo (horas en alg�n caso) en el que la 
consola de R se mostraba pensando hasta que se sub�an todos los datos al SQL 
Server, as� que  dise�e una funci�n que usando el paquete  snowfall mostraba 
una barra de progreso mientras se hacia la subida de datos.
 
Para el flujo de datos en sentido inverso, (de SQL Server a R) siempre me 
aseguro de que la consulta SQL que baja los datos del SQL  Server a un 
dataframe o similar solo recupera los datos verdaderamente necesarios. 
L�gicamente y dependiendo de lo que vayas a hacer luego con esos datos a veces 
esto no es posible, pero en general eso de bajarse todo e intentar ejecutar 
un proceso me parece un h�bito bastante pernicioso e improductivo.
 
 
 
 
 
 
 -Mensaje original-
 De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de r-
 help-es-requ...@r-project.org
 Enviado el: martes, 05 de mayo de 2015 12:00
 Para: r-help-es@r-project.org
 Asunto: Resumen de R-help-es, Vol 75, Env�o 4

 Env�e los mensajes para la lista R-help-es a
   r-help-es@r-project.org

 Para subscribirse o anular su subscripci�n a trav�s de la WEB
   https://stat.ethz.ch/mailman/listinfo/r-help-es

 O por correo electr�nico, enviando un mensaje con el texto help en el
 asunto (subject) o en el cuerpo a:
   r-help-es-requ...@r-project.org

 Puede contactar con el responsable de la lista escribiendo a:
   r-help-es-ow...@r-project.org

 Si responde a alg�n contenido de este mensaje, por favor, edite la linea del
 asunto (subject) para que el texto sea mas especifico que:
 Re: Contents of R-help-es digest Adem�s, por favor, incluya en la
 respuesta s�lo aquellas partes del mensaje a las que est� respondiendo.


 Asuntos del d�a:

1. Muestreo de bases de datos.- (Freddy Omar L�pez Quintero)
2. Re: Muestreo de bases de datos.- (Carlos J. Gil Bellosta )
3. Re: Muestreo de bases de datos.- (javier.ruben.marcu...@gmail.com)


 --

 Message: 1
 Date: Mon, 4 May 2015 15:15:33 -0300
 From: Freddy Omar L�pez Quintero freddy.vat...@gmail.com
 To: r-help-es@r-project.org 

[R-es] Como leer una BD con una estructura inadecuada

2015-04-20 Thread Patricio Fuenmayor Viteri
Hola Eric.Le detallo que es lo que yo hago en estos casos.Identificar el tipo 
de archivo, es decir, que separadores de columnas tiene ?, que tipo de datos 
debe tener cada variable?, etc.Si el archivo es muy grande y un editor de texto 
(como Note++) no lo puede abrir por temas de memoria, puede usar un programa 
adecuado para esto. Yo uso glogg (http://glogg.bonnefon.org/) que me ha 
permitido abrir archivos de texto de hasta 3 GbSi no tiene delimitadores, puede 
usar la opci�n de carga, campos de ancho fijo, en donde usted debe dar las 
longitudes de las variables.Si no puede identificar claramente los tipos de 
datos o los valores por defecto, cargue la variable como character, para que 
luego con las funciones adecuadas, pueda transformarla y obtener los tipo de 
valor y variables deseados.Con respecto a los espacios, c�rgelos como le 
explique, y luego transforme a la variable reemplazando los mismos con la 
funcion grepl y si es mas complicado con una expresi�n regular.Los paquetes que 
le pueden ser de ayuda: data.table (funcion fread), readr, stringr.Espero le 
sirva.Saludos. 
--Archivo adjunto de mensaje reenviado--
From: c...@qualityexcellence.es
CC: r-help-es@r-project.org
To: ericconchamu...@gmail.com
Date: Mon, 20 Apr 2015 11:42:03 +0200
Subject: Re: [R-es] Como leer una BD con una estructura inadecuada
 El 18 de abril de 2015, 20:03, eric ericconchamu...@gmail.com
 mailto:ericconchamu...@gmail.com escribi�:


 Estimados, tengo el siguiente problema:

 Tengo una BD de 19 columnas y aprox 500 mil filas, la que tiene
 muchas celdas vacias y esta separada con espacios para hacer
 coincidir los datos bajo los encabezados.

 Mi problema es que al tratar de importar a R la BD no se como tratar
 con los espacios vacios cuando se trata de una columna de numeros
 (para el texto puse na.strings = NA) y tampoco se como hacer para
 que al leer cada dato este asociado al encabezado correcto, pues el
 numero de espacios que esta puesto entre cada dato varia de acuerdo
 a la extension en caracteres del dato (hay numeros, nombres, etc).
 Incluso hay encabezados de dos palabras y parece que R los considera
 dos encabezados distintos. Me explico ?

 Como puedo hacer para leer la BD correctamente ? Alguna idea ??

 Adjunto un archivo de muestra.

 Muchas gracias.

 Eric.




 --
 Forest Engineer
 Master in Environmental and Natural Resource Economics
 Ph.D. student in Sciences of Natural Resources at La Frontera
 University
 Member in AguaDeTemu2030, citizen movement for Temuco with green
 city standards for living

 Nota: Las tildes se han omitido para asegurar compatibilidad con
 algunos lectores de correo.

 ___
 R-help-es mailing list
 R-help-es@r-project.org mailto:R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es



  
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Ejecución automática de R

2014-09-18 Thread Patricio Fuenmayor Viteri
Hola a todos.Tengo desarrollados varios scripts en R con tareas espec�ficas, 
las cuales deben ejecutarse diariamente.Esta es algo por el momento semi 
autom�tico, algunas he logrado configurarlas en el TASK de WINDOWS, pero otras, 
por su dependencia y complejidad me dan inconvenientes, por lo que su ejecuci�n 
es manual.Han tenido experiencias con la calendarizaci�n de R?, alg�n software 
en especial ?... 
Gracias por compartir sus experiencias...
Patricio. 
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] leer excel

2014-08-15 Thread Patricio Fuenmayor Viteri
Hola Miguel. Una pregunta ... por que el archivo es excel con info en xml 
???por que no es xml directo para poder leerlo con el paquete XML... ??
si me puedes enviar el archivo o un parcial de este ... podria entender mejor 
tu necesidad...Personalmente he tenido muchos inconvenientes con la lectura de 
archivos xls(x|m) con R. Por lo que he definido est�ndares de interfaces y 
estos deben ser archivos planos con delimitadores. La carga es rapida y 
transparente y no requiere de la dependencia de otro software en el flujo (en 
tu caso, Excel).
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] FW: acelerar conexión con RODBC

2014-05-07 Thread Patricio Fuenmayor Viteri
Ok... gracias por las respuestas ...Bueno estoy tratando de usar RMySQL en 
windows ... lamentablemente requiere un poco de trabajo para compilar la 
libreria .. pero ya lo he logrado  .. Mysql lo uso como repositorio historico 
de información ... y todo el trabajo fuerte y dificil lo dejo a R .. . La data 
la extraigo de la BD mediante RODBC (base en SQLServer) la proceso y trabajo en 
data.frames, usando tanto sqldf y plyr. y las respuestas las almaceno en Mysql, 
he aqui donde tengo el lio, tarda mucho al insertar los datos desde R a Mysql 
con RODBC.Si tengo novedades les comento para que quede como ayuda o guia a los 
lectores...esto es lo que me encanta de R ... tengo tantas alternativas para 
solucionar un mismo problema ... 
From: patricio.fuenma...@outlook.com
To: r-help-es@r-project.org
Subject: acelerar conexión con RODBC
Date: Wed, 7 May 2014 10:02:47 -0500




Hola a todos...estoy usando MariaDb como base de datos (similares 
caracteristicas a MySQL), y la conexión entre R y esta con RODBC.¿Existe alguna 
forma de incrementar la conexión para carga de datos ya que son largos, ejm: 
3000 registros en 1 minuto...Si conocen de esto o me pueden sugerir 
alternativas, estaré agradecido.
Patricio.   
  
[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es