Carlos He tecleado lo siguiente para leer el fichero de Stata library(foreign) datos = as.data.frame(read.dta("private98-06more_than9.dta")) save(datos, file="data.RData") load("data.RData") dim(datos) class(datos)
Tiene ese numero de filas y columnas que son las variables. dim(datos)[1] 9418455 28 Mi memoria RAM es 4GB, pero he conseguido leer los datos, y tambien hacer un histograma de age, aunque es dificil ver algo por la cantidad de individuos que hay en la base de datos. hist(datos$age, main="Titulo", xlab="Age") Ya cuando intento ver los valores perdidos con is.na(datos) me sale error Error: cannot allocate vector of size 1006.0 Mb Saludos 2017-12-06 13:49 GMT+01:00 Carlos Ortega <c...@qualityexcellence.es>: > OK. > Lee primero los datos, guarda el data.frame (.RData o en un .csv o lo que > quieras). > Sal de RStudio o incluso reinicia el ordenador para liberar el máximo de > memoria. > > Y comienza una nueva sesión con RStudio cargando los datos con "fread()". > Por otro lado, este conjunto de datos ¿cómo es de grande (filas y > columnas)?. > > ¿Y qué máquina tienes?. ¿Cuanta RAM tienes?. > > Gracias, > Carlos. > > > El 6 de diciembre de 2017, 13:42, Antonio Rodriguez Andres < > antoniorodriguezandre...@gmail.com> escribió: > >> Carlos >> >> use library foreign, y read.dta. Consegui leer los datos. Pero demora >> mucho. explore los datos con head y tail, y con summary. Conseguis los >> resultados. Muy lento. Una cosa a. hacer es un histograma y ahi ya ponia >> cannot allocate memory. >> >> Pense que podria leer los datos de otra manera mas eficiente. >> >> El 6/12/2017 13:32, "Carlos Ortega" <c...@qualityexcellence.es> escribió: >> >>> Pero entonces, ¿has leído ya el fichero en RStudio? ¿lo has convertido >>> de Stata a csv o algún otro formato que con el que puedas trabajar en >>> RStudio?. >>> ¿O ahora el problema es que has convertido el fichero pero no puedes >>> hacer ningún tipo de análisis porque tu equipo no tiene suficientes >>> recursos?... >>> >>> Gracias, >>> Carlos. >>> >>> El 6 de diciembre de 2017, 13:09, Antonio Rodriguez Andres < >>> antoniorodriguezandre...@gmail.com> escribió: >>> >>>> He llegado hacer un summary o algo asi. Despues de leerlo pero tarda >>>> mucho. >>>> Y si hago un histograma de una variable edad, hay colapsa. >>>> >>>> El 6/12/2017 13:05, "Antonio Rodriguez Andres" < >>>> antoniorodriguezandre...@gmail.com> escribió: >>>> >>>> > Freddy >>>> > >>>> > el archivo lo leo en segundos en Stata. puedo probar el paquete >>>> heaven. >>>> > Pero si recuerdo me dio problemas en RStudio >>>> > >>>> > El 6/12/2017 13:03, "Freddy Omar López Quintero" < >>>> freddy.vat...@gmail.com> >>>> > escribió: >>>> > >>>> >> El mié, 06-12-2017 a las 12:55 +0100, Antonio Rodriguez Andres >>>> escribió: >>>> >> >>>> >> me sale problema >>>> >> de memoria. >>>> >> >>>> >> >>>> >> Pregunta posiblemente tonta: ¿tienes suficiente memoria para >>>> procesar un >>>> >> archivo de tales dimensiones? Puede que ni aún cambiando la manera >>>> de leer >>>> >> el archivo realmente lo puedas procesar. >>>> >> >>>> >> >>>> >> Entonces, una solucion es intentar pasar de STATA a CSV y luego usar >>>> el >>>> >> comando fread, y finalmente cargar los datos como RData >>>> >> >>>> >> >>>> >> ¿Has probado el paquete haven y específicamente su función read_dta? >>>> >> Parece que es bastante más eficiente que la de foreign y preserva más >>>> >> características que trae el formato de stata. >>>> >> >>>> >> ¡Ojalá algo sirva! >>>> >> >>>> >> ¡Salud! >>>> >> >>>> >> -- >>>> >> >>>> >> «...homines autem hominum causa esse generatos...» >>>> >> >>>> >> Cicero >>>> >> >>>> > >>>> >>>> [[alternative HTML version deleted]] >>>> >>>> _______________________________________________ >>>> R-help-es mailing list >>>> R-help-es@r-project.org >>>> https://stat.ethz.ch/mailman/listinfo/r-help-es >>>> >>> >>> >>> >>> -- >>> Saludos, >>> Carlos Ortega >>> www.qualityexcellence.es >>> >> > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es > -- Member, Editorial Committee, *The Economic and Labour Relations Review* (a SAGE journal) http://elr.sagepub.com/ Member, Editorial Committee, African Journal of Economic and Management Studies http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile) [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es