[R-es] ¿Es "R" recomendable como lenguaje para alguien que quiere empezar a programar?....
Hola con todos...En mi experiencia, empec� en el mundo de la programaci�n con mi calculadora cient�fica HP48GX con sys rpl, luego pascal, luego visual basic for applications, c++, SQL, SAS, ..., hasta llegar a RYo pienso que depende para que se quiere programar???... obviamente carreras t�cnicas necesitan lenguajes de alto nivel como c++, fortran, etc. si se quiere desarrollar aplicaciones num�ricas y/o cient�ficas..En mi experiencia laboral (entidad financiera), el 70% de la gente que maneja datos usa Excel como �nica herramienta ... a ellos yo si les recomendar�a usar R como reemplazo de Excel en temas de procesamiento de informaci�n, y excel deber�a pasar a ser una herramienta de visualizaci�n y manipulaci�n sencilla de la informaci�n.El 20% ya tiene conocimiento de bases de datos y usa ya sea Access o Sqlserver ... a ellos R ser�a igual una herramienta complementaria para el tratamiento e interacci�n de an�lisis y de resultados con bases de datos.El 10% usa herramientas espec�ficas para manejo y an�lisis de informaci�n, de igual forma R ser�a un reemplazo o un complemento... Con esto quiero hacer notar, ... que los conceptos b�sicos que conlleva el aprendizaje de la programaci�n, R los puede suplir ... pero como les comento, programar para que ??? ... si una vez que entienden el uso y beneficio de todo lo desarrollado ya en R y que est� disponible en toda la gama de paquetes ... la programaci�n pasa a segundo plano, sin descartar que puedan hacer modificaciones y optimizaciones a los desarrollos ya hechos... Conozco "programadores" que hacen pergaminos de c�digo, tan extensos que el mantenimiento es imposible... he tenido que rehacer los mismos y con conceptualizaciones gen�ricas, logr� reducir en un 70 por ciento las lineas de c�digo y crear funciones din�micas param�tricas... mucho m�s �tiles y entendibles.Recuerdo el caso de una compa�era que le pidieron programar la mediana... se hab�a pasado son su hermano toda la noche haciendo el c�digo en SQL ... casi le d�o algo cuando le mostr� que existe una funci�n ya programada para eso...Creo que R es como un mega Lego (juego para armar), depende de la creatividad e inter�s del usuario en saber mas y lograr hacer desarrollos "elegantes" y funcionales.Y pienso que es fundamental entender que R usa la filosof�a: "investiga, y si no est� hecho, hazlo tu mismo"...!!! (no todas las personas pueden con esto) Saludos. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] php-R
Hola...Otra forma y mas robusta.. pienso yo, es usar PL/R http://www.joeconway.com/plr/de esta forma llamas a procedimientos almacenados en postgres y entiendo yo que es mas f�cil la interacci�n entre php y postgres.Es una idea, y de paso ganas mucho en la administraci�n de datos Patricio. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] Operaciones entre conjuntos
Hola a todos...Estoy tratando de hacer un trabajo de comparacion de conjuntos y no entiendo que pasa con los resultados.Me explico. Tengo una columna donde se tiene el nombre de una persona, est� ordenado APELLIDOS - NOMBRESa continuaci�n tengo el el nombre de la misma persona, pero ordenado NOMBRES - APELLIDOS.El proceso debe identificar que las 2 columnas son iguales. Estoy usando operaciones entre conjuntos y estructuras data.tableNo entiendo, porque haciendo en data.table la comparacion me sale FALSA, es decir no son iguales, pero si hago la comparaci�n aparte, sale VERDADEROAdjunto el c�digo... gracias por su apoyo... require(data.table)a - data.table( x = 1:2, y = list(c(ANDRES,GERARDO,CABRERA,GUAMAN), c(MONTALVAN,VERA,JORGE,LEONARDO)), z = list(c(CABRERA,GUAMAN,GERARDO,ANDRES), c(JORGE,MONTALVAN,VERA))) a[,:=(vld=setequal(y,z)),by=x] setequal(c(ANDRES,GERARDO,CABRERA,GUAMAN),c(CABRERA,GUAMAN,GERARDO,ANDRES)) [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] FW: error con cantidades grandes de datos
Saludos.Este momento estoy trabajando con bases de datos SQLSERVER, usando el paquete rsqlserver (github) la tabla a que consulto tiene alrededor de 3millones de registros que tengo que trabajar. Cuando ejecuto la primera vez... sale este errorError: Value of SET_STRING_ELT() must be a 'CHARSXP' not a 'character'lo extra�o es que lo vuelvo a ejecutar ... y ya no da el error.Otro tema extra�o, es que si bajo solo una parte de la base (limit 100) no aparece el error.He le�do mucho sobre esto.. y de lo que entiendo es un tema de incompatibilidad de tipos de datos definidos en R en el c�digo C.Alguien se ha topado con esto ??? y lo importante ... como lo ha tratado o solucionado.Tengo que automatizar los procesos y esto va ha ser un l�o.Gracias por su ayuda. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] error con cantidades grandes de datos
Saludos.Este momento estoy trabajando con bases de datos SQLSERVER, usando el paquete rsqlserver (github) la tabla a que consulto tiene alrededor de 3millones de registros que tengo que trabajar. Cuando ejecuto la primera vez... sale este errorError: Value of SET_STRING_ELT() must be a 'CHARSXP' not a 'character'lo extra�o es que lo vuelvo a ejecutar ... y ya no da el error.Otro tema extra�o, es que si bajo solo una parte de la base (limit 100) no aparece el error.He le�do mucho sobre esto.. y de lo que entiendo es un tema de incompatibilidad de tipos de datos definidos en R en el c�digo C.Alguien se ha topado con esto ??? y lo importante ... como lo ha tratado o solucionado.Tengo que automatizar los procesos y esto va ha ser un l�o.Gracias por su ayuda. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] funciones en estructura data.table
-Mensaje original- De: Patricio Fuenmayor Viteri patricio.fuenma...@outlook.com Enviado: 17 de junio de 2015 6:37 PM Para: r-help...@r-ptoject.org, patricio.fuenma...@outlook.com Asunto: funciones en estructura data.table hola... luego de haber migrado la mayoria de mis procesos a data.table. aun me kedan ciertos detalles por afinar.. eate es un ejemplo de eso.. tengo una tabla de emails y necesito hacer un analisis de dominios... para separar el nombre de usuario el dominio uso la funcion str_split del paquete stringr... pero el resultado me queda en una sola columna y separada por una coma... mi pregunta es ... como puedo hacer ke los multiples resultados de una funcion ... se guarden en diferentes columnas de mi data.table email01[,.(str_split(email))] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Muestreo de bases de datos
Bueno ... voy a compartirles mi experiencia en esto.Freddy, yo tuve la misma experiencia que su amigo, es mas, aun la sigo teniendo... y en resumen y sin alargar el cuento ... me quedo con R.Porque mi decisi�n... por varios temas:1. Rapidez. Uno debe saber que es lo que se quiere hacer y que necesita para eso. El uso adecuado de indices, hash, etc. que permitan y faciliten al sistema trabajar eficientemente. R en mas r�pido que SAS en temas de cruces de datos (yo uso data.table e indexaciones por hash).2. Generalizado, centralizado y normalizado. El uso del concepto de funciones con par�metros, y un solo esquema de lenguaje y la programaci�n orientada a objetos, hace que se faciliten los temas. Programar los procesos usando un flujo y reutilizando las funciones, permiten que a mas de que el proceso sea escalable, su mantenimiento y la incorporaci�n de nuevas funcionalidades, se implemente f�cilmente.3. SAS facilita la conexi�n con diferentes bases de datos (siempre y cuando se tenga licenciado el m�dulo). Es recomendable usar librer�as en R que est�n programadas utilizando conectores nativos, tales como RMySQL, RPostgres, y la nueva que estoy usando rsqlserver (en desarrollo en github), las cuales son muy r�pidas en tiempos de respuesta.4. Programaci�n modular e incorporaci�n de conceptos y tecnolog�as. Esto, en mi caso, lo desarroll� por experiencia. Poder generalizar un proceso de informaci�n, manejar un modelos de datos, para optimizar el almacenaje de los datos y de los resultados, hacen que los tiempo de respuesta hacia el usuario sean cada vez mejores.5. Toda la gama de funciones desarrolladas por la comunidad, y los estudios y an�lisis compartidos en blogs, libros, etc. permiten que la curva de aprendizaje y de desarrollo sea mas corta, ademas uno puede evidenciar y aprender de gente mas experimentada en temas de manejo de informaci�n y de aplicaciones estad�sticas.Bueno... esto es parte de mi experiencia... y no quiero cansarles mas ... un abrazo ... !!! --Archivo adjunto de mensaje reenviado-- From: jluis.gils...@tasacionesh.com To: r-help-es@r-project.org Date: Tue, 5 May 2015 11:12:49 + Subject: Re: [R-es] Muestreo de bases de datos Hola Desvi�ndome un poco de la cuesti�n que plantea Freddy, no estoy muy de acuerdo con lo que comenta acerca de que ... R no est� dise�ado (operaciones en la base de datos)... Precisamente la mayor parte de mi trabajo en R se realiza vinculadolo a un servidor Microsoft SQL Server y lo cierto es que, hasta ahora, se entienden muy bien entre ellos. Cierto es que, en mi caso, la mayor parte del flujo de datos (con millones de registros como norma general) va de R hacia el SQL, puesto que utilizo R para descargar los datos, organizarlos y depurarlos antes de subirlos al SQL server. Al principio me inquietaba mucho el tiempo (horas en alg�n caso) en el que la consola de R se mostraba pensando hasta que se sub�an todos los datos al SQL Server, as� que dise�e una funci�n que usando el paquete snowfall mostraba una barra de progreso mientras se hacia la subida de datos. Para el flujo de datos en sentido inverso, (de SQL Server a R) siempre me aseguro de que la consulta SQL que baja los datos del SQL Server a un dataframe o similar solo recupera los datos verdaderamente necesarios. L�gicamente y dependiendo de lo que vayas a hacer luego con esos datos a veces esto no es posible, pero en general eso de bajarse todo e intentar ejecutar un proceso me parece un h�bito bastante pernicioso e improductivo. -Mensaje original- De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de r- help-es-requ...@r-project.org Enviado el: martes, 05 de mayo de 2015 12:00 Para: r-help-es@r-project.org Asunto: Resumen de R-help-es, Vol 75, Env�o 4 Env�e los mensajes para la lista R-help-es a r-help-es@r-project.org Para subscribirse o anular su subscripci�n a trav�s de la WEB https://stat.ethz.ch/mailman/listinfo/r-help-es O por correo electr�nico, enviando un mensaje con el texto help en el asunto (subject) o en el cuerpo a: r-help-es-requ...@r-project.org Puede contactar con el responsable de la lista escribiendo a: r-help-es-ow...@r-project.org Si responde a alg�n contenido de este mensaje, por favor, edite la linea del asunto (subject) para que el texto sea mas especifico que: Re: Contents of R-help-es digest Adem�s, por favor, incluya en la respuesta s�lo aquellas partes del mensaje a las que est� respondiendo. Asuntos del d�a: 1. Muestreo de bases de datos.- (Freddy Omar L�pez Quintero) 2. Re: Muestreo de bases de datos.- (Carlos J. Gil Bellosta ) 3. Re: Muestreo de bases de datos.- (javier.ruben.marcu...@gmail.com) -- Message: 1 Date: Mon, 4 May 2015 15:15:33 -0300 From: Freddy Omar L�pez Quintero freddy.vat...@gmail.com To: r-help-es@r-project.org
[R-es] Como leer una BD con una estructura inadecuada
Hola Eric.Le detallo que es lo que yo hago en estos casos.Identificar el tipo de archivo, es decir, que separadores de columnas tiene ?, que tipo de datos debe tener cada variable?, etc.Si el archivo es muy grande y un editor de texto (como Note++) no lo puede abrir por temas de memoria, puede usar un programa adecuado para esto. Yo uso glogg (http://glogg.bonnefon.org/) que me ha permitido abrir archivos de texto de hasta 3 GbSi no tiene delimitadores, puede usar la opci�n de carga, campos de ancho fijo, en donde usted debe dar las longitudes de las variables.Si no puede identificar claramente los tipos de datos o los valores por defecto, cargue la variable como character, para que luego con las funciones adecuadas, pueda transformarla y obtener los tipo de valor y variables deseados.Con respecto a los espacios, c�rgelos como le explique, y luego transforme a la variable reemplazando los mismos con la funcion grepl y si es mas complicado con una expresi�n regular.Los paquetes que le pueden ser de ayuda: data.table (funcion fread), readr, stringr.Espero le sirva.Saludos. --Archivo adjunto de mensaje reenviado-- From: c...@qualityexcellence.es CC: r-help-es@r-project.org To: ericconchamu...@gmail.com Date: Mon, 20 Apr 2015 11:42:03 +0200 Subject: Re: [R-es] Como leer una BD con una estructura inadecuada El 18 de abril de 2015, 20:03, eric ericconchamu...@gmail.com mailto:ericconchamu...@gmail.com escribi�: Estimados, tengo el siguiente problema: Tengo una BD de 19 columnas y aprox 500 mil filas, la que tiene muchas celdas vacias y esta separada con espacios para hacer coincidir los datos bajo los encabezados. Mi problema es que al tratar de importar a R la BD no se como tratar con los espacios vacios cuando se trata de una columna de numeros (para el texto puse na.strings = NA) y tampoco se como hacer para que al leer cada dato este asociado al encabezado correcto, pues el numero de espacios que esta puesto entre cada dato varia de acuerdo a la extension en caracteres del dato (hay numeros, nombres, etc). Incluso hay encabezados de dos palabras y parece que R los considera dos encabezados distintos. Me explico ? Como puedo hacer para leer la BD correctamente ? Alguna idea ?? Adjunto un archivo de muestra. Muchas gracias. Eric. -- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo. ___ R-help-es mailing list R-help-es@r-project.org mailto:R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] Ejecución automática de R
Hola a todos.Tengo desarrollados varios scripts en R con tareas espec�ficas, las cuales deben ejecutarse diariamente.Esta es algo por el momento semi autom�tico, algunas he logrado configurarlas en el TASK de WINDOWS, pero otras, por su dependencia y complejidad me dan inconvenientes, por lo que su ejecuci�n es manual.Han tenido experiencias con la calendarizaci�n de R?, alg�n software en especial ?... Gracias por compartir sus experiencias... Patricio. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] leer excel
Hola Miguel. Una pregunta ... por que el archivo es excel con info en xml ???por que no es xml directo para poder leerlo con el paquete XML... ?? si me puedes enviar el archivo o un parcial de este ... podria entender mejor tu necesidad...Personalmente he tenido muchos inconvenientes con la lectura de archivos xls(x|m) con R. Por lo que he definido est�ndares de interfaces y estos deben ser archivos planos con delimitadores. La carga es rapida y transparente y no requiere de la dependencia de otro software en el flujo (en tu caso, Excel). [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] FW: acelerar conexión con RODBC
Ok... gracias por las respuestas ...Bueno estoy tratando de usar RMySQL en windows ... lamentablemente requiere un poco de trabajo para compilar la libreria .. pero ya lo he logrado .. Mysql lo uso como repositorio historico de información ... y todo el trabajo fuerte y dificil lo dejo a R .. . La data la extraigo de la BD mediante RODBC (base en SQLServer) la proceso y trabajo en data.frames, usando tanto sqldf y plyr. y las respuestas las almaceno en Mysql, he aqui donde tengo el lio, tarda mucho al insertar los datos desde R a Mysql con RODBC.Si tengo novedades les comento para que quede como ayuda o guia a los lectores...esto es lo que me encanta de R ... tengo tantas alternativas para solucionar un mismo problema ... From: patricio.fuenma...@outlook.com To: r-help-es@r-project.org Subject: acelerar conexión con RODBC Date: Wed, 7 May 2014 10:02:47 -0500 Hola a todos...estoy usando MariaDb como base de datos (similares caracteristicas a MySQL), y la conexión entre R y esta con RODBC.¿Existe alguna forma de incrementar la conexión para carga de datos ya que son largos, ejm: 3000 registros en 1 minuto...Si conocen de esto o me pueden sugerir alternativas, estaré agradecido. Patricio. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es