De nada...
He leído lo que has escrito...
Bueno, hay muchas formas de hacer las cosas... te recomiendo que uses el
paquete data.table (pero la versión en desarrollo 1.9.7 )
https://github.com/Rdatatable/data.table/wiki
la que te ayudará en el tema de memoria... Otra cosa que te recomiendo es
que revises un poco de expresiones regulares, las que te permiten encontrar
patrones en tu información y hace que el filtrado, reemplazo y extracción
sean mas fáciles.
Si me explicas un poco mas el porque del merge, creo que usa solución que
implementé te va ha ayudar mucho ... es creando keys con hash (md5).
Saludos

El 9 de agosto de 2016, 10:01, Mauricio Monsalvo <m.monsa...@gmail.com>
escribió:

> Muy claro, Patrico. Muchas gracias!
>
> El 5 de agosto de 2016, 14:45, patricio fuenmayor <
> patricio.fuenma...@gmail.com> escribió:
>
>> Hola Mauricio.
>> He trabajado en proyectos de calidad de datos, y lo primero y esencial es
>> realizar un "profile" de la información. esto consiste es breves
>> estadísticas descriptivas tanto en variables cualitativas y cuantitativas.
>> Una vez que tengas claras las características de la forma como te envían la
>> información, puedes configurar las funciones de R para que las cargue
>> correctamente.
>>
>> Recomiendo usar la función data.table::fread, esta realiza muestreos en
>> la información e infiere los posibles tipos de datos, separadores, etc. Una
>> vez cargada la información en R puedes usar muchas mas funciones para
>> revisar los datos.
>> El tema de los factores a mi modo de ver, se debe tratar en las
>> instancias finales al preparar la información para el modelamiento.
>> Los factores son una especie de recodificación de los datos donde asigna
>> un índice a un valor ... por ejemplo se tiene los valores en una variable:
>> casa, auto, moto, bicicleta... si es tipo caracter se almacenan en memoria
>> los caracteres... si es factor, hace la conversión internamente asignando
>> por ejemplo: casa=1, auto=2, moto=3, bicicleta=4 ... de tal forma que en
>> memoria se guardan los indices ... esto hace que la base tenga menos tamaño
>> ... ya que guarda números en lugar de textos y otras cosas mas ... lo que
>> al parecer te pasa a ti ... es que al hacerlo factor a un numero ... lo que
>> te va a mostar es el indice ... mas no el valor del numero.
>> si tienes 10, 5, 32, 49 ... el factor hará: 10=1, 5=2, 32=3, 49=4, lo
>> cual lleva a confusión...
>>
>> Saludos.
>>
>>
>
>
> --
> Mauricio
>

        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Responder a