Hola Mauricio, Para hacer alguna prueba más, yo lo único que echo de menos es que nos pudieras dar un "ejemplo reproducible" y para esto no hay nada mejor que nos pases una parte representativa del conjunto de datos.
Además de lo ya expuesto, se pueden utilizar otras alternativas de lectura del fichero a la de "read.table()", por ejemplo la que ofrece "fread()" del paquete "data.table" o la "read_csv()" del paquete "readr". En los que no hace falta declarar a priori el tipo de cada columna ya que automática los infieren de una lectura inicial (200-300 líneas). Gracias, Carlos Ortega www.qualityexcellence.es El 5 de agosto de 2016, 5:04, <javier.ruben.marcu...@gmail.com> escribió: > Estimado Mauricio Monsalvo > > ¿Puede usar esos datos importados a una base de datos? Por ejemplo en > mysql un código como puede ser: > SELECT email, COUNT(*) Total > FROM clientes > GROUP BY email > HAVING COUNT(*) > 1 > > Para buscar los duplicados (en este caso correos electrónicos), la idea es > conocer las variables y cantidades, una vez que las conoce puede actualizar > para ir normalizando los datos (desde el punto de vista de la base de > datos). Luego solo tendría un problema, conocer los decimales, pero eso ya > fue resuelto anteriormente por la base de datos al importar los datos, o > fueron importados como cadena (varchar, etc.). En ese caso tendría unas > nuevas columnas que llenaría con consultas. > > Cuándo pueda tener los datos bien almacenados, recién piense en > importarlos a R, datos mal almacenados son casi imposible de recuperar en R. > > Por desgracia datos mal almacenados es algo común, ¿puede ingresar al > almacenamiento a un nivel más adecuado?, me refiero a algo más próximo a > los originales para poder usted mismo acomodarlos para luego exportarlos a > R. > > Otra forma pero que requiere conocimientos de programación, es leer el > archivo desde un lenguaje de programación, C#, Java, C++, F, y acomodar > desde alguno de estos, pero para eso también debería conocer muy bien como > acomodar los datos, sería muy sencillo cometer un error lógico (hay > resultados procesados correctamente, pero obteniendo valores inadecuados, > por el error de lógica). > > Javier Rubén Marcuzzi > > De: Mauricio Monsalvo > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es