[R-es] Ayuda con kproto- Desviacion tipica

2024-04-06 Thread Antonio Rodriguez Andres
Hola usuarios de R

Cuando aplico k prototype

clustering <- kproto(x = data, k = 3, verbose = TRUE, lambda = 2)

El objeto clustering no es un data frame,

y summary(clustering) me da las medias para variables numéricas

pero me gustaría obtener la desviación típica.  Una forma que podría
ser es crear unos dataframes de la siguiente forma


df1 = data.frame(kp[["centers"]][["Individualism"]])

df2 = data.frame(kp[["data"]][["Individualism"]])

En data tengo los datos originales con sus variables numericas y factores
genero un 3 conjunto de datos

df3 <-qpcR:::cbind.na(df1, df2), donde me aparece como columna el
centroide para la variable

individualismo para los 3 clusters, y la otra columna la variable
original individualismo. Entiendo que debo de introducir otra columna

con las asignación de cluster y calcular fácilmente la desviación típica??

¿Hay alguna otra forma de hacer esto?

saludos

Tony

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review: *

https://www.cambridge.org/core/journals/the-economic-and-labour-relations-review

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Guardar etiquetas de variables en R para exportarlo a Stata

2021-04-23 Thread Antonio Rodriguez Andres
Buenos días

Tengo un conjunto de datos con formato .dta, y los leo bien en R como
dataframe, e incluso con las etiquetas. Después de transformar la lista de
datos a dataframe, los quiero volver a llevar a Stata, pero conservando las
etiquetas, pero al hacerlo, no se mantienen las etiquetas por columnas, hay
alguna forma de hacer eso,

El código es este

l = list.files(
pattern = "dta",
path = "C:/Users/anton/OneDrive/Escritorio/Eglantina/Data/",
full.names = TRUE
 )


datafiles1 = lapply(fl, rio::import_list) uso el paquete rio

names(datafiles1) = tools::file_path_sans_ext(fl)
str(datafiles1)
#Convertir lista en dataframes

df1 <- plyr::ldply(datafiles1, data.frame)

haven::write_dta(df1, "mydata.dta") # salvar el conjunto de datos en
formato de Stata. dta

Hay alguna forma de mantener las etiquetas para cada variable?

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Interpolación lineal por grupos

2019-11-25 Thread Antonio Rodriguez Andres
Hola a todos

Tengo datos por paises y en el tiempo sobre costes de exportacion.
Aparentemente hace bien el codigo la interpolacion, pero en algunos casos
me da valores negativos
coste.imputado
2630
*2199*
*1768*
*1337*
*906*
*-347*
*177*

El codigo es este
df_imputed <- datos %>%
  group_by(country) %>%
  mutate(costexportimputado =
   
approxExtrap(which(!is.na(costexport)),costexport[!is.na(costexport)],xout
= 1:n(), rule =1)$y)

Alguna idea de que puede fallar

saludos
-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Plot. window error- Usando R base. Gráfico

2019-09-04 Thread Antonio Rodriguez Andres
Aqui estan en formato csv,

Antonio

On Wed, 4 Sep 2019 at 19:19, Carlos Ortega  wrote:

> ¿Puedes compartir los datos?...
> No veo otra forma...
>
> El mié., 4 sept. 2019 a las 18:54, Antonio Rodriguez Andres (<
> antoniorodriguezandre...@gmail.com>) escribió:
>
>> No me sale error pero no me imprime la linea, ni ningun gráfico por pais.
>>
>> On Wed, 4 Sep 2019 at 18:42, neo  wrote:
>>
>>> podría ser el problema el tipo de dato en X y el tipo de gráfico que
>>> intentas hacer ?
>>>
>>> si Year es entero y estas pidiendo que el gráfico sea tipo "I", podría
>>> ser que quizá eso te produce el error ?
>>>
>>> si pruebas a cambiar X a numérico (continuo) ?
>>>
>>> Slds,
>>>
>>> Eric.
>>>
>>>
>>>
>>>
>>> On 04-09-19 13:06, Antonio Rodriguez Andres wrote:
>>> > Lo que obtengo es dim(currcty)  = NULL
>>> >
>>> > lo que hice es crear una lista de paises
>>> >
>>> > countrylist <- unique(length(eco_freedom2$Countries)
>>> >
>>> > Los datos son de esta forma
>>> > head(eco_freedom2, 5)
>>> >  Year ISO_Code Countries SUMMARY.INDEX X1..Size.of.Government
>>> > 641 2000  AGOAngolaNA NA
>>> > 601 2001  AGOAngolaNA NA
>>> > 561 2002  AGOAngolaNA NA
>>> > 521 2003  AGOAngolaNA NA
>>> > 481 2004  AGOAngolaNA NA
>>> >
>>> > On Wed, 4 Sep 2019 at 16:53, Carlos Ortega 
>>> wrote:
>>> >
>>> >> ¿Puedes compartir los datos?..
>>> >>
>>> >> Otra cosa que puede ayudar es esto lo destaco en rojo.
>>> >> Creo que en alguno de los casos te quedas sin datos en tu data.frame.
>>> >>
>>> >> Con ese mensaje puedes ver justamente el tamaño de cada dataframe en
>>> cada
>>> >> iteración.
>>> >>
>>> >>
>>> >> for (i in 1:length(countrylist)){
>>> >>   currcty <- countrylist[i]
>>> >>  * print(dim(currcty))*
>>> >>  filename <- paste("index",currcty,".png",sep="")
>>> >>  png(filename,width=800,height=600)
>>> >>
>>> >> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
>>> >> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85,
>>> 8.20),
>>> >> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR", main =
>>> >> paste("Countries", currcty))
>>> >>  dev.off()
>>> >>}
>>> >>
>>> >> El mié., 4 sept. 2019 a las 14:52, Antonio Rodriguez Andres (<
>>> >> antoniorodriguezandre...@gmail.com>) escribió:
>>> >>
>>> >>> Carlos
>>> >>> Al especificar los limites, no me sale ningun error, aunque no
>>> consigue
>>> >>> graficar, nada,
>>> >>>
>>> >>>
>>> >>># Look at the time series for each country for the time period,
>>> for
>>> >>> instance GDPPC
>>> >>>for (i in 1:length(countrylist)){
>>> >>>   currcty <- countrylist[i]
>>> >>>  filename <- paste("index",currcty,".png",sep="")
>>> >>>  png(filename,width=800,height=600)
>>> >>>
>>> >>> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
>>> >>> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85,
>>> 8.20),
>>> >>> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR",
>>> >>>   main = paste("Countries", currcty))
>>> >>>  dev.off()
>>> >>>}
>>> >>>
>>> >>> On Wed, 4 Sep 2019 at 11:57, Carlos Ortega >> >
>>> >>> wrote:
>>> >>>
>>> >>>> Hola,
>>> >>>>
>>> >>>> Pon un "print(i)" en tu bucle para ver en qué número/paso del bucle
>>> te
>>> >>>> aparece el error.
>>> >>>&g

Re: [R-es] Plot. window error- Usando R base. Gráfico

2019-09-04 Thread Antonio Rodriguez Andres
No me sale error pero no me imprime la linea, ni ningun gráfico por pais.

On Wed, 4 Sep 2019 at 18:42, neo  wrote:

> podría ser el problema el tipo de dato en X y el tipo de gráfico que
> intentas hacer ?
>
> si Year es entero y estas pidiendo que el gráfico sea tipo "I", podría
> ser que quizá eso te produce el error ?
>
> si pruebas a cambiar X a numérico (continuo) ?
>
> Slds,
>
> Eric.
>
>
>
>
> On 04-09-19 13:06, Antonio Rodriguez Andres wrote:
> > Lo que obtengo es dim(currcty)  = NULL
> >
> > lo que hice es crear una lista de paises
> >
> > countrylist <- unique(length(eco_freedom2$Countries)
> >
> > Los datos son de esta forma
> > head(eco_freedom2, 5)
> >  Year ISO_Code Countries SUMMARY.INDEX X1..Size.of.Government
> > 641 2000  AGOAngolaNA NA
> > 601 2001  AGOAngolaNA NA
> > 561 2002  AGOAngolaNA NA
> > 521 2003  AGOAngolaNA NA
> > 481 2004  AGOAngolaNA NA
> >
> > On Wed, 4 Sep 2019 at 16:53, Carlos Ortega 
> wrote:
> >
> >> ¿Puedes compartir los datos?..
> >>
> >> Otra cosa que puede ayudar es esto lo destaco en rojo.
> >> Creo que en alguno de los casos te quedas sin datos en tu data.frame.
> >>
> >> Con ese mensaje puedes ver justamente el tamaño de cada dataframe en
> cada
> >> iteración.
> >>
> >>
> >> for (i in 1:length(countrylist)){
> >>   currcty <- countrylist[i]
> >>  * print(dim(currcty))*
> >>  filename <- paste("index",currcty,".png",sep="")
> >>  png(filename,width=800,height=600)
> >>
> >> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
> >> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85,
> 8.20),
> >> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR", main =
> >> paste("Countries", currcty))
> >>  dev.off()
> >>}
> >>
> >> El mié., 4 sept. 2019 a las 14:52, Antonio Rodriguez Andres (<
> >> antoniorodriguezandre...@gmail.com>) escribió:
> >>
> >>> Carlos
> >>> Al especificar los limites, no me sale ningun error, aunque no consigue
> >>> graficar, nada,
> >>>
> >>>
> >>># Look at the time series for each country for the time period, for
> >>> instance GDPPC
> >>>for (i in 1:length(countrylist)){
> >>>   currcty <- countrylist[i]
> >>>  filename <- paste("index",currcty,".png",sep="")
> >>>  png(filename,width=800,height=600)
> >>>
> >>> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
> >>> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85,
> 8.20),
> >>> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR",
> >>>   main = paste("Countries", currcty))
> >>>  dev.off()
> >>>}
> >>>
> >>> On Wed, 4 Sep 2019 at 11:57, Carlos Ortega 
> >>> wrote:
> >>>
> >>>> Hola,
> >>>>
> >>>> Pon un "print(i)" en tu bucle para ver en qué número/paso del bucle te
> >>>> aparece el error.
> >>>> Y con ese "i" haz la selección del dataframe y mira que pasa.. puede
> que
> >>>> para ese caso, al quitar los NAs te quedes sin datos...
> >>>>
> >>>> Es una forma de debugear...
> >>>>
> >>>> Gracias,
> >>>> Carlos Ortega
> >>>> www.qualityexcellence.es
> >>>>
> >>>>
> >>>> El mié., 4 sept. 2019 a las 11:17, Antonio Rodriguez Andres (<
> >>>> antoniorodriguezandre...@gmail.com>) escribió:
> >>>>
> >>>>> Hola queridos usuarios de R
> >>>>>
> >>>>> Estoy intentando hacer un gráfico de una variable en el tiempo para
> un
> >>>>> conjunto de países usando R base, con el comando plot. Tengo 40
> países y
> >>>>> son 15 años. Lo quiero salvar como formato png, cada uno de ellos.
> >>>>>
> >>>>> Tengo el siguiente código,
> >>>

Re: [R-es] Plot. window error- Usando R base. Gráfico

2019-09-04 Thread Antonio Rodriguez Andres
Lo que obtengo es dim(currcty)  = NULL

lo que hice es crear una lista de paises

countrylist <- unique(length(eco_freedom2$Countries)

Los datos son de esta forma
head(eco_freedom2, 5)
Year ISO_Code Countries SUMMARY.INDEX X1..Size.of.Government
641 2000  AGOAngolaNA NA
601 2001  AGOAngolaNA NA
561 2002  AGOAngolaNA NA
521 2003  AGOAngolaNA NA
481 2004  AGOAngolaNA NA

On Wed, 4 Sep 2019 at 16:53, Carlos Ortega  wrote:

> ¿Puedes compartir los datos?..
>
> Otra cosa que puede ayudar es esto lo destaco en rojo.
> Creo que en alguno de los casos te quedas sin datos en tu data.frame.
>
> Con ese mensaje puedes ver justamente el tamaño de cada dataframe en cada
> iteración.
>
>
> for (i in 1:length(countrylist)){
>  currcty <- countrylist[i]
> * print(dim(currcty))*
> filename <- paste("index",currcty,".png",sep="")
> png(filename,width=800,height=600)
>
> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85, 8.20),
> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR", main =
> paste("Countries", currcty))
> dev.off()
>   }
>
> El mié., 4 sept. 2019 a las 14:52, Antonio Rodriguez Andres (<
> antoniorodriguezandre...@gmail.com>) escribió:
>
>> Carlos
>> Al especificar los limites, no me sale ningun error, aunque no consigue
>> graficar, nada,
>>
>>
>>   # Look at the time series for each country for the time period, for
>> instance GDPPC
>>   for (i in 1:length(countrylist)){
>>  currcty <- countrylist[i]
>> filename <- paste("index",currcty,".png",sep="")
>> png(filename,width=800,height=600)
>>
>> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
>> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85, 8.20),
>> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR",
>>  main = paste("Countries", currcty))
>> dev.off()
>>   }
>>
>> On Wed, 4 Sep 2019 at 11:57, Carlos Ortega 
>> wrote:
>>
>>> Hola,
>>>
>>> Pon un "print(i)" en tu bucle para ver en qué número/paso del bucle te
>>> aparece el error.
>>> Y con ese "i" haz la selección del dataframe y mira que pasa.. puede que
>>> para ese caso, al quitar los NAs te quedes sin datos...
>>>
>>> Es una forma de debugear...
>>>
>>> Gracias,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>>
>>> El mié., 4 sept. 2019 a las 11:17, Antonio Rodriguez Andres (<
>>> antoniorodriguezandre...@gmail.com>) escribió:
>>>
>>>> Hola queridos usuarios de R
>>>>
>>>> Estoy intentando hacer un gráfico de una variable en el tiempo para un
>>>> conjunto de países usando R base, con el comando plot. Tengo 40 países y
>>>> son 15 años. Lo quiero salvar como formato png, cada uno de ellos.
>>>>
>>>> Tengo el siguiente código,
>>>>
>>>> for (i in 1:length(countrylist)){
>>>> currcty <- countrylist[i]
>>>> filename <- paste("index",currcty,".png",sep="")
>>>> png(filename,width=800,height=600)
>>>>
>>>> plot(y=eco_freedom2$SUMMARY.INDEX[eco_freedom2$Countries==currcty],
>>>> x=eco_freedom2$Year[eco_freedom2$Countries==currcty], type="l",
>>>> ylab="INDEX",xlab="YEAR",
>>>>  main = paste("Countries", currcty))
>>>> dev.off()
>>>>   }
>>>>
>>>> Pero me aparece el error Error in plot.window(...) : se necesitan
>>>> valores
>>>> finitos de 'xlim'. La variable y = SUMMARY.INDEX tiene valores Nas, y es
>>>> tipo numerico, y la variable x= Year es integer. Entiendo que es por el
>>>> problema de los NAs, por lo que da error.
>>>> Si embargo al usar na.omit(dataset), y quedarnos con los valores que no
>>>> son
>>>> NA, me sigue saliendo el mismo error
>>>>
>>>> Alguna idea,
>>>>
>>>> gracias
>>>>
>>>> --
>>>>
>>>> Member, Editorial Committee, *The Economic and Labo

Re: [R-es] Plot. window error- Usando R base. Gráfico

2019-09-04 Thread Antonio Rodriguez Andres
Gracias lo miro

El mié., 4 sept. 2019 16:53, Carlos Ortega 
escribió:

> ¿Puedes compartir los datos?..
>
> Otra cosa que puede ayudar es esto lo destaco en rojo.
> Creo que en alguno de los casos te quedas sin datos en tu data.frame.
>
> Con ese mensaje puedes ver justamente el tamaño de cada dataframe en cada
> iteración.
>
>
> for (i in 1:length(countrylist)){
>  currcty <- countrylist[i]
> * print(dim(currcty))*
> filename <- paste("index",currcty,".png",sep="")
> png(filename,width=800,height=600)
>
> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85, 8.20),
> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR", main =
> paste("Countries", currcty))
> dev.off()
>   }
>
> El mié., 4 sept. 2019 a las 14:52, Antonio Rodriguez Andres (<
> antoniorodriguezandre...@gmail.com>) escribió:
>
>> Carlos
>> Al especificar los limites, no me sale ningun error, aunque no consigue
>> graficar, nada,
>>
>>
>>   # Look at the time series for each country for the time period, for
>> instance GDPPC
>>   for (i in 1:length(countrylist)){
>>  currcty <- countrylist[i]
>> filename <- paste("index",currcty,".png",sep="")
>> png(filename,width=800,height=600)
>>
>> plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
>> x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85, 8.20),
>> xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR",
>>  main = paste("Countries", currcty))
>> dev.off()
>>   }
>>
>> On Wed, 4 Sep 2019 at 11:57, Carlos Ortega 
>> wrote:
>>
>>> Hola,
>>>
>>> Pon un "print(i)" en tu bucle para ver en qué número/paso del bucle te
>>> aparece el error.
>>> Y con ese "i" haz la selección del dataframe y mira que pasa.. puede que
>>> para ese caso, al quitar los NAs te quedes sin datos...
>>>
>>> Es una forma de debugear...
>>>
>>> Gracias,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>>
>>> El mié., 4 sept. 2019 a las 11:17, Antonio Rodriguez Andres (<
>>> antoniorodriguezandre...@gmail.com>) escribió:
>>>
>>>> Hola queridos usuarios de R
>>>>
>>>> Estoy intentando hacer un gráfico de una variable en el tiempo para un
>>>> conjunto de países usando R base, con el comando plot. Tengo 40 países y
>>>> son 15 años. Lo quiero salvar como formato png, cada uno de ellos.
>>>>
>>>> Tengo el siguiente código,
>>>>
>>>> for (i in 1:length(countrylist)){
>>>> currcty <- countrylist[i]
>>>> filename <- paste("index",currcty,".png",sep="")
>>>> png(filename,width=800,height=600)
>>>>
>>>> plot(y=eco_freedom2$SUMMARY.INDEX[eco_freedom2$Countries==currcty],
>>>> x=eco_freedom2$Year[eco_freedom2$Countries==currcty], type="l",
>>>> ylab="INDEX",xlab="YEAR",
>>>>  main = paste("Countries", currcty))
>>>> dev.off()
>>>>   }
>>>>
>>>> Pero me aparece el error Error in plot.window(...) : se necesitan
>>>> valores
>>>> finitos de 'xlim'. La variable y = SUMMARY.INDEX tiene valores Nas, y es
>>>> tipo numerico, y la variable x= Year es integer. Entiendo que es por el
>>>> problema de los NAs, por lo que da error.
>>>> Si embargo al usar na.omit(dataset), y quedarnos con los valores que no
>>>> son
>>>> NA, me sigue saliendo el mismo error
>>>>
>>>> Alguna idea,
>>>>
>>>> gracias
>>>>
>>>> --
>>>>
>>>> Member, Editorial Committee, *The Economic and Labour Relations Review*
>>>> (a
>>>> SAGE journal)
>>>>
>>>> http://elr.sagepub.com/
>>>>
>>>> Member, Editorial Committee, African Journal of Economic and Management
>>>> Studies
>>>>
>>>>
>>>> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>>>>
>>>> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
>>>> profile)
>>>>
>>>> [[alternative HTML version deleted]]
>>>>
>>>> ___
>>>> R-help-es mailing list
>>>> R-help-es@r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>> --
>>
>> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
>> SAGE journal)
>>
>> http://elr.sagepub.com/
>>
>> Member, Editorial Committee, African Journal of Economic and Management
>> Studies
>>
>>
>> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>>
>> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
>> profile)
>>
>>
>>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Plot. window error- Usando R base. Gráfico

2019-09-04 Thread Antonio Rodriguez Andres
Carlos
Al especificar los limites, no me sale ningun error, aunque no consigue
graficar, nada,


  # Look at the time series for each country for the time period, for
instance GDPPC
  for (i in 1:length(countrylist)){
 currcty <- countrylist[i]
filename <- paste("index",currcty,".png",sep="")
png(filename,width=800,height=600)
plot(y=eco_freedom3$SUMMARY.INDEX[eco_freedom3$Countries==currcty],
x=eco_freedom3$Year[eco_freedom3$Countries==currcty], ylim = c(2.85, 8.20),
xlim = c(2000, 2016), type="l", ylab="INDEX",xlab="YEAR",
 main = paste("Countries", currcty))
dev.off()
  }

On Wed, 4 Sep 2019 at 11:57, Carlos Ortega  wrote:

> Hola,
>
> Pon un "print(i)" en tu bucle para ver en qué número/paso del bucle te
> aparece el error.
> Y con ese "i" haz la selección del dataframe y mira que pasa.. puede que
> para ese caso, al quitar los NAs te quedes sin datos...
>
> Es una forma de debugear...
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El mié., 4 sept. 2019 a las 11:17, Antonio Rodriguez Andres (<
> antoniorodriguezandre...@gmail.com>) escribió:
>
>> Hola queridos usuarios de R
>>
>> Estoy intentando hacer un gráfico de una variable en el tiempo para un
>> conjunto de países usando R base, con el comando plot. Tengo 40 países y
>> son 15 años. Lo quiero salvar como formato png, cada uno de ellos.
>>
>> Tengo el siguiente código,
>>
>> for (i in 1:length(countrylist)){
>> currcty <- countrylist[i]
>> filename <- paste("index",currcty,".png",sep="")
>> png(filename,width=800,height=600)
>>
>> plot(y=eco_freedom2$SUMMARY.INDEX[eco_freedom2$Countries==currcty],
>> x=eco_freedom2$Year[eco_freedom2$Countries==currcty], type="l",
>> ylab="INDEX",xlab="YEAR",
>>  main = paste("Countries", currcty))
>> dev.off()
>>   }
>>
>> Pero me aparece el error Error in plot.window(...) : se necesitan valores
>> finitos de 'xlim'. La variable y = SUMMARY.INDEX tiene valores Nas, y es
>> tipo numerico, y la variable x= Year es integer. Entiendo que es por el
>> problema de los NAs, por lo que da error.
>> Si embargo al usar na.omit(dataset), y quedarnos con los valores que no
>> son
>> NA, me sigue saliendo el mismo error
>>
>> Alguna idea,
>>
>> gracias
>>
>> --
>>
>> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
>> SAGE journal)
>>
>> http://elr.sagepub.com/
>>
>> Member, Editorial Committee, African Journal of Economic and Management
>> Studies
>>
>>
>> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>>
>> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
>> profile)
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Plot. window error- Usando R base. Gráfico

2019-09-04 Thread Antonio Rodriguez Andres
Ok gracias

On Wed, 4 Sep 2019 at 11:57, Carlos Ortega  wrote:

> Hola,
>
> Pon un "print(i)" en tu bucle para ver en qué número/paso del bucle te
> aparece el error.
> Y con ese "i" haz la selección del dataframe y mira que pasa.. puede que
> para ese caso, al quitar los NAs te quedes sin datos...
>
> Es una forma de debugear...
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El mié., 4 sept. 2019 a las 11:17, Antonio Rodriguez Andres (<
> antoniorodriguezandre...@gmail.com>) escribió:
>
>> Hola queridos usuarios de R
>>
>> Estoy intentando hacer un gráfico de una variable en el tiempo para un
>> conjunto de países usando R base, con el comando plot. Tengo 40 países y
>> son 15 años. Lo quiero salvar como formato png, cada uno de ellos.
>>
>> Tengo el siguiente código,
>>
>> for (i in 1:length(countrylist)){
>> currcty <- countrylist[i]
>> filename <- paste("index",currcty,".png",sep="")
>> png(filename,width=800,height=600)
>>
>> plot(y=eco_freedom2$SUMMARY.INDEX[eco_freedom2$Countries==currcty],
>> x=eco_freedom2$Year[eco_freedom2$Countries==currcty], type="l",
>> ylab="INDEX",xlab="YEAR",
>>  main = paste("Countries", currcty))
>> dev.off()
>>   }
>>
>> Pero me aparece el error Error in plot.window(...) : se necesitan valores
>> finitos de 'xlim'. La variable y = SUMMARY.INDEX tiene valores Nas, y es
>> tipo numerico, y la variable x= Year es integer. Entiendo que es por el
>> problema de los NAs, por lo que da error.
>> Si embargo al usar na.omit(dataset), y quedarnos con los valores que no
>> son
>> NA, me sigue saliendo el mismo error
>>
>> Alguna idea,
>>
>> gracias
>>
>> --
>>
>> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
>> SAGE journal)
>>
>> http://elr.sagepub.com/
>>
>> Member, Editorial Committee, African Journal of Economic and Management
>> Studies
>>
>>
>> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>>
>> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
>> profile)
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Plot. window error- Usando R base. Gráfico

2019-09-04 Thread Antonio Rodriguez Andres
Hola queridos usuarios de R

Estoy intentando hacer un gráfico de una variable en el tiempo para un
conjunto de países usando R base, con el comando plot. Tengo 40 países y
son 15 años. Lo quiero salvar como formato png, cada uno de ellos.

Tengo el siguiente código,

for (i in 1:length(countrylist)){
currcty <- countrylist[i]
filename <- paste("index",currcty,".png",sep="")
png(filename,width=800,height=600)
plot(y=eco_freedom2$SUMMARY.INDEX[eco_freedom2$Countries==currcty],
x=eco_freedom2$Year[eco_freedom2$Countries==currcty], type="l",
ylab="INDEX",xlab="YEAR",
 main = paste("Countries", currcty))
dev.off()
  }

Pero me aparece el error Error in plot.window(...) : se necesitan valores
finitos de 'xlim'. La variable y = SUMMARY.INDEX tiene valores Nas, y es
tipo numerico, y la variable x= Year es integer. Entiendo que es por el
problema de los NAs, por lo que da error.
Si embargo al usar na.omit(dataset), y quedarnos con los valores que no son
NA, me sigue saliendo el mismo error

Alguna idea,

gracias

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Uso de merge

2019-03-25 Thread Antonio Rodriguez Andres
Jose Luis

Column `Country` joining factors with different levels, coercing to
character vector

common_col_names <- intersect(names(sub_kei), names(knowledge))
> common_col_names
[1] "Country" "Year"

nrow(sub_kei) <- 132
nrow(knowledge) <- 3864

Tiene distinto numero de pais como de año, en el sub_kei aparecen 5 años y
en el otro dataset (knowledge) datos anuales de 1995 a 2017. Yo quiero que
el merge dataset aparezcan todos los años

 countrylist <-unique(sub_kei$Country)
> countrylist
 [1] ArgentinaBrazil   Colombia China
  Czech Republic
 [6] Greece   Hungary  India
IndonesiaIsrael
[11] Malaysia Mexico   Pakistan Peru
 Philippines
[16] Poland   QatarRussian Federation   Saudi
Arabia Thailand
[21] Turkey   United Arab Emirates
22 Levels: Argentina Brazil China Colombia Czech Republic Greece Hungary
India Indonesia Israel ... United Arab Emirates

On Mon, 25 Mar 2019 at 22:08, jose luis  wrote:

> Hola
> prueba con
> library(dplyr)
> combine <- full_join(sub_kei, knowledge)
>
>
> El Lunes 25 de marzo de 2019 19:49, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
>
> Hola usuarios de R
>
> Estoy tratando de usar merge, para dos data frame, sin embargo al usarlo me
> da resultado correcto, en términos de emparejamiento de pais y año, pero lo
> que me hace es que el dataframe *y* me hace como un append por filas. Las
> variables comunes son país y año. Alguna sugerencia?
>
>
> combine = merge(sub_kei, knowledge, by = common_col_names, all.x = TRUE,
> all.y = TRUE)
> Saludos
>
> --
>
> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
> SAGE journal)
>
> http://elr.sagepub.com/
>
> Member, Editorial Committee, African Journal of Economic and Management
> Studies
>
>
> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>
> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
> profile)
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Uso de merge

2019-03-25 Thread Antonio Rodriguez Andres
Hola usuarios de R

Estoy tratando de usar merge, para dos data frame, sin embargo al usarlo me
da resultado correcto, en términos de emparejamiento de pais y año, pero lo
que me hace es que el dataframe *y* me hace como un append por filas. Las
variables comunes son país y año. Alguna sugerencia?


combine = merge(sub_kei, knowledge, by = common_col_names, all.x = TRUE,
all.y = TRUE)
Saludos

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Crear una variable tipo factor a partir de un vector de caracteres

2019-03-08 Thread Antonio Rodriguez Andres
Aqui adjunto el código que finalmente funcionó, por si alguien pudiera
necesitarlo en el futuro en la lista


func1 <- function(x){
  ifelse(x %in% ca, "Central Africa", ifelse(x %in% ea,"East Africa",
ifelse(x%in% sa, "South Africa", ifelse(x%in% wa, "West Africa",
ifelse(x%in% na, "North Africa", "otros")
}

afdata$region <- func1(afdata$Country)

afdata$region = as.factor(afdata$region)

On Wed, 6 Mar 2019 at 15:44, Carlos J. Gil Bellosta 
wrote:

> Con R base:
>
> paises <- factor(c("a", "b", "c", "c", "a"))
>
> zonas <- c("norte", "norte", "sur")
> names(zonas) <- c("a", "b", "c")
>
> zonas_paises <- paises
> levels(zonas_paises) <- zonas[levels(zonas_paises)]
> zonas_paises
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
> El mié., 6 mar. 2019 a las 15:41, Xavier-Andoni Tibau Alberdi (<
> xaviti...@gmail.com>) escribió:
>
>> No, No. Fíjate en el Ifelse(condición, valor si positivo, valor si
>> negativo).
>>
>> Si, x %in% ca entonces el valor devuelto es "ca", un factor. En caso
>> negativo, vamos al siguiente bloque iflese, que comprueba si el país esta
>> en el siguiente grupo, na. Si está en na nos devuelve "na". Vamos, que la
>> función mira en que grupo esta ese país y te devuelve una string,
>> correspondiente al país. Así que ahora tienes un factor, con 5 posibles
>> valores ("ca", "na", ..., "ea"). Es lo que quieres no?
>>
>> Xavier Tibau
>>
>> Missatge de Antonio Rodriguez Andres 
>> del dia dc., 6 de març 2019 a les 15:34:
>>
>> > Pero eso es para crear variables binarias tipo 0-1 si el pais pertence a
>> > un determinado grupo. Lo que quiero es crear una variable de tipo factor
>> > con esos 5 niveles, sabiendo que tengo en el dataframe una variable
>> llamada
>> > Country, con el nombre del pais.
>> > Gracias
>> >
>> > On Wed, 6 Mar 2019 at 15:27, Xavier-Andoni Tibau Alberdi <
>> > xaviti...@gmail.com> wrote:
>> >
>> >> Buenas,
>> >>
>> >> Para ello yo uso el operador %in%, que me dice si algo esta dentro de
>> un
>> >> vector. Luego hago bucles de if else, pero usando la función iflese().
>> Si
>> >> país X esta en países lista ca, entonces "ca",etc. Puedes crear una
>> función
>> >> que englobe ese iflese(), para aplicarla para cada columna del
>> dataframe.
>> >>
>> >> Algo así como:
>> >>
>> >> func1 <- func (x) {ifelse(x %in% ca, "ca", ifelse(x %in% na,"na", ...,
>> >> ifelse(x %in% ea, "ea", "otros"))...)}
>> >>
>> >> espero que te sirva!
>> >>
>> >> Xavier Tibau
>> >>
>> >>
>> >>
>> >> Missatge de Antonio Rodriguez Andres <
>> antoniorodriguezandre...@gmail.com>
>> >> del dia dc., 6 de març 2019 a les 15:10:
>> >>
>> >>> Hola estimados miembros de la comunidad de R
>> >>>
>> >>> Tengo un conjunto de datos, donde tengo observaciones por países y por
>> >>> año.
>> >>> Una de las variables del dataframe es el nombre del país. Queremos
>> >>> dividir
>> >>> los países, que son países africanos de acuerdo a 5 regiones: norte de
>> >>> africa, africa del este, sur africa, etc
>> >>>
>> >>> Yo lo que he hecho ha sido crear vectores con el nombre de cada uno de
>> >>> los
>> >>> países en cada uno de ellos, por ejemplo este de Africa Central,
>> >>>
>> >>> ca <- c("Angola", "Cameroon", "Cabo Verde", "Central African
>> Republic",
>> >>> "Chad","Equatorial Guinea", "Eritrea", "Ethiopia",
>> >>> "Gabon", "Sao Tome and Principe")
>> >>> class(ca)
>> >>> character
>> >>>
>> >>> luego hice un ifelse para crear una variable binaria 1 si es pais de
>> >>> Central Africa y cero sino lo es
>> >>>
>> >>> afdata$Country.centralafrica <- ifelse(afdata$Country %in% ca,1,0)
>> >>>
>> >>> Sin embargo, para el análisis podría ser más interesante crear una
>> 

Re: [R-es] Crear una variable tipo factor a partir de un vector de caracteres

2019-03-06 Thread Antonio Rodriguez Andres
Gracias

On Wed, 6 Mar 2019 at 15:47, Xavier-Andoni Tibau Alberdi <
xaviti...@gmail.com> wrote:

> Pues ahí lo tienes. Usa %in% para ver si esta en ese grupo, y en caso de
> estarlo pones el nombre del grupo. Aquí un ejemplo.
> https://www.datamentor.io/r-programming/ifelse-function/
>
> Saludos,
>
> Xavi
>
> Missatge de Antonio Rodriguez Andres 
> del dia dc., 6 de març 2019 a les 15:44:
>
>> Si lo que quiero es crear una variable llamada por ejemplo region (del
>> tipo factor) con esos 5 valores
>>
>> On Wed, 6 Mar 2019 at 15:41, Xavier-Andoni Tibau Alberdi <
>> xaviti...@gmail.com> wrote:
>>
>>> No, No. Fíjate en el Ifelse(condición, valor si positivo, valor si
>>> negativo).
>>>
>>> Si, x %in% ca entonces el valor devuelto es "ca", un factor. En caso
>>> negativo, vamos al siguiente bloque iflese, que comprueba si el país esta
>>> en el siguiente grupo, na. Si está en na nos devuelve "na". Vamos, que la
>>> función mira en que grupo esta ese país y te devuelve una string,
>>> correspondiente al país. Así que ahora tienes un factor, con 5 posibles
>>> valores ("ca", "na", ..., "ea"). Es lo que quieres no?
>>>
>>> Xavier Tibau
>>>
>>> Missatge de Antonio Rodriguez Andres 
>>> del dia dc., 6 de març 2019 a les 15:34:
>>>
>>>> Pero eso es para crear variables binarias tipo 0-1 si el pais pertence
>>>> a un determinado grupo. Lo que quiero es crear una variable de tipo factor
>>>> con esos 5 niveles, sabiendo que tengo en el dataframe una variable llamada
>>>> Country, con el nombre del pais.
>>>> Gracias
>>>>
>>>> On Wed, 6 Mar 2019 at 15:27, Xavier-Andoni Tibau Alberdi <
>>>> xaviti...@gmail.com> wrote:
>>>>
>>>>> Buenas,
>>>>>
>>>>> Para ello yo uso el operador %in%, que me dice si algo esta dentro de
>>>>> un vector. Luego hago bucles de if else, pero usando la función iflese().
>>>>> Si país X esta en países lista ca, entonces "ca",etc. Puedes crear una
>>>>> función que englobe ese iflese(), para aplicarla para cada columna del
>>>>> dataframe.
>>>>>
>>>>> Algo así como:
>>>>>
>>>>> func1 <- func (x) {ifelse(x %in% ca, "ca", ifelse(x %in% na,"na", ...,
>>>>> ifelse(x %in% ea, "ea", "otros"))...)}
>>>>>
>>>>> espero que te sirva!
>>>>>
>>>>> Xavier Tibau
>>>>>
>>>>>
>>>>>
>>>>> Missatge de Antonio Rodriguez Andres <
>>>>> antoniorodriguezandre...@gmail.com> del dia dc., 6 de març 2019 a les
>>>>> 15:10:
>>>>>
>>>>>> Hola estimados miembros de la comunidad de R
>>>>>>
>>>>>> Tengo un conjunto de datos, donde tengo observaciones por países y
>>>>>> por año.
>>>>>> Una de las variables del dataframe es el nombre del país. Queremos
>>>>>> dividir
>>>>>> los países, que son países africanos de acuerdo a 5 regiones: norte de
>>>>>> africa, africa del este, sur africa, etc
>>>>>>
>>>>>> Yo lo que he hecho ha sido crear vectores con el nombre de cada uno
>>>>>> de los
>>>>>> países en cada uno de ellos, por ejemplo este de Africa Central,
>>>>>>
>>>>>> ca <- c("Angola", "Cameroon", "Cabo Verde", "Central African
>>>>>> Republic",
>>>>>> "Chad","Equatorial Guinea", "Eritrea", "Ethiopia",
>>>>>> "Gabon", "Sao Tome and Principe")
>>>>>> class(ca)
>>>>>> character
>>>>>>
>>>>>> luego hice un ifelse para crear una variable binaria 1 si es pais de
>>>>>> Central Africa y cero sino lo es
>>>>>>
>>>>>> afdata$Country.centralafrica <- ifelse(afdata$Country %in% ca,1,0)
>>>>>>
>>>>>> Sin embargo, para el análisis podría ser más interesante crear una
>>>>>> variable
>>>>>> nueva por ejemplo region y tratarla como factor,. Mi pregunta es como
>>>>>> podria pasar esos 5 vectores con el nombre de los paises de cada
>>&

Re: [R-es] Crear una variable tipo factor a partir de un vector de caracteres

2019-03-06 Thread Antonio Rodriguez Andres
Si lo que quiero es crear una variable llamada por ejemplo region (del tipo
factor) con esos 5 valores

On Wed, 6 Mar 2019 at 15:41, Xavier-Andoni Tibau Alberdi <
xaviti...@gmail.com> wrote:

> No, No. Fíjate en el Ifelse(condición, valor si positivo, valor si
> negativo).
>
> Si, x %in% ca entonces el valor devuelto es "ca", un factor. En caso
> negativo, vamos al siguiente bloque iflese, que comprueba si el país esta
> en el siguiente grupo, na. Si está en na nos devuelve "na". Vamos, que la
> función mira en que grupo esta ese país y te devuelve una string,
> correspondiente al país. Así que ahora tienes un factor, con 5 posibles
> valores ("ca", "na", ..., "ea"). Es lo que quieres no?
>
> Xavier Tibau
>
> Missatge de Antonio Rodriguez Andres 
> del dia dc., 6 de març 2019 a les 15:34:
>
>> Pero eso es para crear variables binarias tipo 0-1 si el pais pertence a
>> un determinado grupo. Lo que quiero es crear una variable de tipo factor
>> con esos 5 niveles, sabiendo que tengo en el dataframe una variable llamada
>> Country, con el nombre del pais.
>> Gracias
>>
>> On Wed, 6 Mar 2019 at 15:27, Xavier-Andoni Tibau Alberdi <
>> xaviti...@gmail.com> wrote:
>>
>>> Buenas,
>>>
>>> Para ello yo uso el operador %in%, que me dice si algo esta dentro de un
>>> vector. Luego hago bucles de if else, pero usando la función iflese(). Si
>>> país X esta en países lista ca, entonces "ca",etc. Puedes crear una función
>>> que englobe ese iflese(), para aplicarla para cada columna del dataframe.
>>>
>>> Algo así como:
>>>
>>> func1 <- func (x) {ifelse(x %in% ca, "ca", ifelse(x %in% na,"na", ...,
>>> ifelse(x %in% ea, "ea", "otros"))...)}
>>>
>>> espero que te sirva!
>>>
>>> Xavier Tibau
>>>
>>>
>>>
>>> Missatge de Antonio Rodriguez Andres 
>>> del dia dc., 6 de març 2019 a les 15:10:
>>>
>>>> Hola estimados miembros de la comunidad de R
>>>>
>>>> Tengo un conjunto de datos, donde tengo observaciones por países y por
>>>> año.
>>>> Una de las variables del dataframe es el nombre del país. Queremos
>>>> dividir
>>>> los países, que son países africanos de acuerdo a 5 regiones: norte de
>>>> africa, africa del este, sur africa, etc
>>>>
>>>> Yo lo que he hecho ha sido crear vectores con el nombre de cada uno de
>>>> los
>>>> países en cada uno de ellos, por ejemplo este de Africa Central,
>>>>
>>>> ca <- c("Angola", "Cameroon", "Cabo Verde", "Central African Republic",
>>>> "Chad","Equatorial Guinea", "Eritrea", "Ethiopia",
>>>> "Gabon", "Sao Tome and Principe")
>>>> class(ca)
>>>> character
>>>>
>>>> luego hice un ifelse para crear una variable binaria 1 si es pais de
>>>> Central Africa y cero sino lo es
>>>>
>>>> afdata$Country.centralafrica <- ifelse(afdata$Country %in% ca,1,0)
>>>>
>>>> Sin embargo, para el análisis podría ser más interesante crear una
>>>> variable
>>>> nueva por ejemplo region y tratarla como factor,. Mi pregunta es como
>>>> podria pasar esos 5 vectores con el nombre de los paises de cada region
>>>> a
>>>> una sola variable tratada como un factor y con esos 5 niveles ( 5
>>>> regiones). Lo que he tratado es de hacer esto para genera una nueva
>>>> variable en el dataframe, pero me da que todo es igual false, en el
>>>> valor,
>>>>
>>>> afdata$region <- with(afdata,{
>>>>   (Country == "ca" |Country == "na" | Country == "sa" | Country == "wa"
>>>> |
>>>> Country == "ea")
>>>> })
>>>> Debo de indicar otra condición?
>>>>
>>>> Agradezco alguna pista
>>>>
>>>> --
>>>>
>>>> Member, Editorial Committee, *The Economic and Labour Relations Review*
>>>> (a
>>>> SAGE journal)
>>>>
>>>> http://elr.sagepub.com/
>>>>
>>>> Member, Editorial Committee, African Journal of Economic and Management
>>>> Studies
>>>>
>>>>
>>>> http://emeraldgrouppublishing.com/products/journals/editorial_team

Re: [R-es] Crear una variable tipo factor a partir de un vector de caracteres

2019-03-06 Thread Antonio Rodriguez Andres
Pero eso es para crear variables binarias tipo 0-1 si el pais pertence a un
determinado grupo. Lo que quiero es crear una variable de tipo factor con
esos 5 niveles, sabiendo que tengo en el dataframe una variable llamada
Country, con el nombre del pais.
Gracias

On Wed, 6 Mar 2019 at 15:27, Xavier-Andoni Tibau Alberdi <
xaviti...@gmail.com> wrote:

> Buenas,
>
> Para ello yo uso el operador %in%, que me dice si algo esta dentro de un
> vector. Luego hago bucles de if else, pero usando la función iflese(). Si
> país X esta en países lista ca, entonces "ca",etc. Puedes crear una función
> que englobe ese iflese(), para aplicarla para cada columna del dataframe.
>
> Algo así como:
>
> func1 <- func (x) {ifelse(x %in% ca, "ca", ifelse(x %in% na,"na", ...,
> ifelse(x %in% ea, "ea", "otros"))...)}
>
> espero que te sirva!
>
> Xavier Tibau
>
>
>
> Missatge de Antonio Rodriguez Andres 
> del dia dc., 6 de març 2019 a les 15:10:
>
>> Hola estimados miembros de la comunidad de R
>>
>> Tengo un conjunto de datos, donde tengo observaciones por países y por
>> año.
>> Una de las variables del dataframe es el nombre del país. Queremos dividir
>> los países, que son países africanos de acuerdo a 5 regiones: norte de
>> africa, africa del este, sur africa, etc
>>
>> Yo lo que he hecho ha sido crear vectores con el nombre de cada uno de los
>> países en cada uno de ellos, por ejemplo este de Africa Central,
>>
>> ca <- c("Angola", "Cameroon", "Cabo Verde", "Central African Republic",
>> "Chad","Equatorial Guinea", "Eritrea", "Ethiopia",
>> "Gabon", "Sao Tome and Principe")
>> class(ca)
>> character
>>
>> luego hice un ifelse para crear una variable binaria 1 si es pais de
>> Central Africa y cero sino lo es
>>
>> afdata$Country.centralafrica <- ifelse(afdata$Country %in% ca,1,0)
>>
>> Sin embargo, para el análisis podría ser más interesante crear una
>> variable
>> nueva por ejemplo region y tratarla como factor,. Mi pregunta es como
>> podria pasar esos 5 vectores con el nombre de los paises de cada region a
>> una sola variable tratada como un factor y con esos 5 niveles ( 5
>> regiones). Lo que he tratado es de hacer esto para genera una nueva
>> variable en el dataframe, pero me da que todo es igual false, en el valor,
>>
>> afdata$region <- with(afdata,{
>>   (Country == "ca" |Country == "na" | Country == "sa" | Country == "wa" |
>> Country == "ea")
>> })
>> Debo de indicar otra condición?
>>
>> Agradezco alguna pista
>>
>> --
>>
>> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
>> SAGE journal)
>>
>> http://elr.sagepub.com/
>>
>> Member, Editorial Committee, African Journal of Economic and Management
>> Studies
>>
>>
>> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>>
>> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
>> profile)
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Crear una variable tipo factor a partir de un vector de caracteres

2019-03-06 Thread Antonio Rodriguez Andres
Hola estimados miembros de la comunidad de R

Tengo un conjunto de datos, donde tengo observaciones por países y por año.
Una de las variables del dataframe es el nombre del país. Queremos dividir
los países, que son países africanos de acuerdo a 5 regiones: norte de
africa, africa del este, sur africa, etc

Yo lo que he hecho ha sido crear vectores con el nombre de cada uno de los
países en cada uno de ellos, por ejemplo este de Africa Central,

ca <- c("Angola", "Cameroon", "Cabo Verde", "Central African Republic",
"Chad","Equatorial Guinea", "Eritrea", "Ethiopia",
"Gabon", "Sao Tome and Principe")
class(ca)
character

luego hice un ifelse para crear una variable binaria 1 si es pais de
Central Africa y cero sino lo es

afdata$Country.centralafrica <- ifelse(afdata$Country %in% ca,1,0)

Sin embargo, para el análisis podría ser más interesante crear una variable
nueva por ejemplo region y tratarla como factor,. Mi pregunta es como
podria pasar esos 5 vectores con el nombre de los paises de cada region a
una sola variable tratada como un factor y con esos 5 niveles ( 5
regiones). Lo que he tratado es de hacer esto para genera una nueva
variable en el dataframe, pero me da que todo es igual false, en el valor,

afdata$region <- with(afdata,{
  (Country == "ca" |Country == "na" | Country == "sa" | Country == "wa" |
Country == "ea")
})
Debo de indicar otra condición?

Agradezco alguna pista

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cambiar el formato de datos

2019-02-19 Thread Antonio Rodriguez Andres
 Gracias, ya lo tengo

gather(pobla, key = year, value = totpop, year60:year63) %>%
+   arrange(Country)
   Country   year   totpop
1  Afghanistan year60  8996351
2  Afghanistan year61  9166764
3  Afghanistan year62  9345868
4  Afghanistan year63  9533954

On Tue, 19 Feb 2019 at 14:17, Carlos Ortega 
wrote:

> Después del "gather()" puedes hacer un "arrange()" que es una ordenación.
> Y dentro de "arrange()" le indicas la variable por la que ordenas (no hacen
> falta comillas)...
> Lo ordenará alfabéticamente.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El mar., 19 feb. 2019 a las 13:47, Antonio Rodriguez Andres (<
> antoniorodriguezandre...@gmail.com>) escribió:
>
>> Carlos, para poner despues del gather, las observaciones e Afganistan
>> para todos los años consecutivos, alguna pista?
>>
>> Afghanistan year60  8996351
>> 2  Albania year60  1608800
>> 3  Algeria year60 11124888
>> 4  Andorra year6013411
>> 5   Angola year60  5643182
>> 6  Afghanistan year61  9166764
>> 7  Albania year61  1659800
>>
>> On Tue, 19 Feb 2019 at 13:31, Antonio Rodriguez Andres <
>> antoniorodriguezandre...@gmail.com> wrote:
>>
>>> > gather(pobla, key = year, value = totpop, year60:year63)
>>>
>>> Country   year   totpop
>>> 1  Afghanistan year60  8996351
>>> 2  Albania year60  1608800
>>> 3  Algeria year60 11124888
>>> 4  Andorra year6013411
>>>
>>> Gracias Carlos
>>>
>>> Antonio
>>>
>>> On Tue, 19 Feb 2019 at 12:54, Carlos Ortega 
>>> wrote:
>>>
>>>> Sí, tienes varias formas.
>>>>
>>>> Mira la función "gather()" del paquete "tidyr", es la que te va a
>>>> resultar más fácil de usar.
>>>>
>>>> Gracias,
>>>> Carlos Ortega
>>>> www.qualityexcellence.es
>>>>
>>>> El mar., 19 feb. 2019 a las 9:51, Antonio Rodriguez Andres (<
>>>> antoniorodriguezandre...@gmail.com>) escribió:
>>>>
>>>>> Estimados miembros de la comunidad de R
>>>>>
>>>>> Tengo el siguiente formato en un fichero csv que corresponde a datos
>>>>> de la
>>>>> población para un conjunto de países y para un rango amplio de años.
>>>>>
>>>>> Pais 19601961  1962  1963
>>>>> Albaniav
>>>>> Algeria v  
>>>>>
>>>>> Me gustaría pasarlo a la siguiente forma
>>>>> Pais   Año Poblacion
>>>>> Albania   1960vvv
>>>>> Albania1961   
>>>>> Albania1962
>>>>> Albania1963
>>>>> Algeria 1960
>>>>> .etc
>>>>>
>>>>> Alguna pista de como implementarlo en R. Muchas gracias de antemano
>>>>>
>>>>> Saludos
>>>>>
>>>>> Antonio
>>>>>
>>>>> [[alternative HTML version deleted]]
>>>>>
>>>>> ___
>>>>> R-help-es mailing list
>>>>> R-help-es@r-project.org
>>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>>
>>>>
>>>>
>>>> --
>>>> Saludos,
>>>> Carlos Ortega
>>>> www.qualityexcellence.es
>>>>
>>>
>>>
>>> --
>>>
>>> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
>>> SAGE journal)
>>>
>>> http://elr.sagepub.com/
>>>
>>> Member, Editorial Committee, African Journal of Economic and Management
>>> Studies
>>>
>>>
>>> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>>>
>>> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
>>> profile)
>>>
>>>
>>>
>>
>> --
>>
>> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
>> SAGE journal)
>>
>> http://elr.sagepub.com/
>>
>> Member, Editorial Committee, African Journal of Economic and Management
>> Studies
>>
>>
>> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>>
>> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
>> profile)
>>
>>
>>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cambiar el formato de datos

2019-02-19 Thread Antonio Rodriguez Andres
Carlos, para poner despues del gather, las observaciones e Afganistan para
todos los años consecutivos, alguna pista?

Afghanistan year60  8996351
2  Albania year60  1608800
3  Algeria year60 11124888
4  Andorra year6013411
5   Angola year60  5643182
6  Afghanistan year61  9166764
7  Albania year61  1659800

On Tue, 19 Feb 2019 at 13:31, Antonio Rodriguez Andres <
antoniorodriguezandre...@gmail.com> wrote:

> > gather(pobla, key = year, value = totpop, year60:year63)
>
> Country   year   totpop
> 1  Afghanistan year60  8996351
> 2  Albania year60  1608800
> 3  Algeria year60 11124888
> 4  Andorra year6013411
>
> Gracias Carlos
>
> Antonio
>
> On Tue, 19 Feb 2019 at 12:54, Carlos Ortega 
> wrote:
>
>> Sí, tienes varias formas.
>>
>> Mira la función "gather()" del paquete "tidyr", es la que te va a
>> resultar más fácil de usar.
>>
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El mar., 19 feb. 2019 a las 9:51, Antonio Rodriguez Andres (<
>> antoniorodriguezandre...@gmail.com>) escribió:
>>
>>> Estimados miembros de la comunidad de R
>>>
>>> Tengo el siguiente formato en un fichero csv que corresponde a datos de
>>> la
>>> población para un conjunto de países y para un rango amplio de años.
>>>
>>> Pais 19601961  1962  1963
>>> Albaniav
>>> Algeria v  
>>>
>>> Me gustaría pasarlo a la siguiente forma
>>> Pais   Año Poblacion
>>> Albania   1960vvv
>>> Albania1961   
>>> Albania1962
>>> Albania1963
>>> Algeria 1960
>>> .etc
>>>
>>> Alguna pista de como implementarlo en R. Muchas gracias de antemano
>>>
>>> Saludos
>>>
>>> Antonio
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
>
> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
> SAGE journal)
>
> http://elr.sagepub.com/
>
> Member, Editorial Committee, African Journal of Economic and Management
> Studies
>
>
> http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems
>
> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
> profile)
>
>
>

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cambiar el formato de datos

2019-02-19 Thread Antonio Rodriguez Andres
> gather(pobla, key = year, value = totpop, year60:year63)

Country   year   totpop
1  Afghanistan year60  8996351
2  Albania year60  1608800
3  Algeria year60 11124888
4  Andorra year6013411

Gracias Carlos

Antonio

On Tue, 19 Feb 2019 at 12:54, Carlos Ortega 
wrote:

> Sí, tienes varias formas.
>
> Mira la función "gather()" del paquete "tidyr", es la que te va a resultar
> más fácil de usar.
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
> El mar., 19 feb. 2019 a las 9:51, Antonio Rodriguez Andres (<
> antoniorodriguezandre...@gmail.com>) escribió:
>
>> Estimados miembros de la comunidad de R
>>
>> Tengo el siguiente formato en un fichero csv que corresponde a datos de la
>> población para un conjunto de países y para un rango amplio de años.
>>
>> Pais 19601961  1962  1963
>> Albaniav
>> Algeria v  
>>
>> Me gustaría pasarlo a la siguiente forma
>> Pais   Año Poblacion
>> Albania   1960vvv
>> Albania1961   
>> Albania1962
>> Albania1963
>> Algeria 1960
>> .etc
>>
>> Alguna pista de como implementarlo en R. Muchas gracias de antemano
>>
>> Saludos
>>
>> Antonio
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Cambiar el formato de datos

2019-02-19 Thread Antonio Rodriguez Andres
Estimados miembros de la comunidad de R

Tengo el siguiente formato en un fichero csv que corresponde a datos de la
población para un conjunto de países y para un rango amplio de años.

Pais 19601961  1962  1963
Albaniav
Algeria v  

Me gustaría pasarlo a la siguiente forma
Pais   Año Poblacion
Albania   1960vvv
Albania1961   
Albania1962
Albania1963
Algeria 1960
.etc

Alguna pista de como implementarlo en R. Muchas gracias de antemano

Saludos

Antonio

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Bookdown/error al usar split_by chapter

2018-08-28 Thread Antonio Rodriguez Andres
Estimada lista

Estoy escribiendo un libro y en principio tengo los capitulos en Rmd files
y un fichero indice (Rmd.) y no me da problemas al compilar el libro tanto
en html como en pdf.

La cabecera del fichero indice (el primer Rmd) es,

---
title: "Analisis estadistico"
author: "Antonio R.A"
site: bookdown::bookdown_site
documentclass: book
output:
  bookdown::gitbook: default
  bookdown::pdf_book: default
---
Sin embargo si intento crear ficheros pdf de cada uno de los capitulos
modifico ese fichero con la opcion split_by pero me da error, alguna idea
de porque

---
title: "Economic Analysis using R"
author: "Antonio Rodriguez Andres"
site: bookdown::bookdown_site
documentclass: book
output:
  split_by: chapter
bookdown::gitbook: default
  bookdown::pdf_book: default
---

Saludos Antonio
-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] logo RMARKDOWN

2018-06-07 Thread Antonio Rodriguez Andres
Gracias Francisco

Si en beamer, con ese comando afiliacion, te lo resuelve. Sin embargo creer
un fichero tex, con lo que pones debajo para insertar el logo pero al
ejecutar la presentacion no me aparece el logo, quizas tema de tamaño. El
fichero tex, esta donde el documento Rmarkdown

Alguna idea, y muchas gracias

title: 'INTRODUCTION TO ECONOMETRICS'
subtitle: "International Summer School of Economic, Financial and
Management Studies. 2018"
author: "Dr. Antonio Rodriguez Andres"
affiliation: "TU"
date: "06 June 2018"
output: beamer_presentation
includes:
  in_header: style.tex

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Problemas en documento Rmarkdown (logo y afiliacion)

2018-06-06 Thread Antonio Rodriguez Andres
Estimados usuarios de R

Estaba creando un documento que queria tener en formato pdf. Me voy al YAML
front, pero creo que me deja solo titulo, y subtitulo, no me deja poner
afiliación, y deberia tener un logo cada diapositiva. Tengo esto como
comienzo del documento Rmarkdown, alguna sugerencia, para poner afiliacion
y logo,
Saludos

---
title: 'Motivation'
subtitle: "International Summer School of Economic, Financial and
Management Studies"
author: "Dr. Antonio Rodriguez Andres"
date: "09 May 2018"
output: pdf_document

Saludos

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Interpretación NA's

2018-04-20 Thread Antonio Rodriguez Andres
Quizas es que si el precio es constante y tienes una constante en tu
modelo, eso crea multicolinealidad, y elimina una de las variables

Antonio

-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] STATA base de datos

2017-12-08 Thread Antonio Rodriguez Andres
Carlos, Javier y demas usuarios que respondieron la duda

Uso Windows, y la version de R que uso es


R version 3.4.1 (2017-06-30) -- "Single Candle"
Copyright (C) 2017 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)

La memoria Ram del ordenador es de 4 GB y usa Windows 8. Ayer use la 2
opcion, y borre los datos que tenia con rm () y
despues teclee gc(). Me demoro como dos minutos en ejecutar el script,
pero lo va haciendo.Otra opcion como dices es seleccionar una parte de
la muestra e ir trabajando con eso, y luego una vez que lo tengo claro
puedo ejecutar el script con todos los datos.

Por ultimo lo que yo tengo es un panel de datos, con individuos y la
variable tiempo. Tengo la variable year y el id que identifica los
individuos en el tiempo. Finalmente te pongo la distribucion del numero de
observaciones en el tiempo

> tail(datos)   year idorg idzam id typ drvl zemea zemeb nace2
1: 2006 18985 5 189855   14CZ  60
2: 2000 20620 5 206205   1965
3: 2006  4136   222  413600222   12CZ  74
4: 2005  7004 5  70045   17FR  74
5: 2005 11063 5 110635   1229
6: 2002  8682 5  86825   1464


> table (datos$year)
   1998199920002001200220032004
 790355  822131  863246  928732 1013467 1082701 1168270
   20052006
1273828 1475725

Saludos y muchas gracias de antemano

Antonio



2017-12-06 22:32 GMT+01:00 Carlos Ortega <c...@qualityexcellence.es>:

> Sí, estás un tanto al límite de la capacidad de tu ordenador.
> Varias cosas que no has comentado:
>
>- ¿Qué versión de R usas?
>- ¿Usas una versión de 32bits ó 64bits?.
>- ¿Windows?, supongo.
>   - En Windows puedes ver los recursos de tu máquina y confirmar que
>   cuando tienes el conjunto cargado en R estás muy al límite de tu RAM.
>
> Con todo esto cosas que puedes hacer:
>
>- Hacer un muestreo. Nada más cargar el conjunto puedes hacer algo
>como esto:
>
> # De esta forma te quedas con un 75% de los datos.
>
> datos_samp <- datos[ sample(1:nrow(datos), nrow(datos)*0.75) , ]
>
> rm(datos)
>
> Y a partir de aquí ya trabajas con datos_samp
>
>
>- ​Puedes convertir tus datos​ a data.table (no sé si lo has usado
>antes... que permite comprimir el data.frame. Lo harías así:
>
>
> library(foreign)
>
> ​library(data.table)​
>
> datos = as.data.
> ​table​
> (read.dta("private98-06more_than9.dta"))
>
>
> Y a partir ya trabajar con "datos" como data.table.
>
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El 6 de diciembre de 2017, 22:03, Javier Marcuzzi <
> javier.ruben.marcu...@gmail.com> escribió:
>
>> Estimados
>>
>> Pienso que falta memoria, aparte de las sugerencias ya aportadas, de
>> pronto se podrían colocar algunos rm(liberar_de_memoria), para no tener
>> ocupado espacio que no es requerido porque ese paso ya fue realizado.
>>
>> Javier Rubén Marcuzzi
>>
>> El 6 de diciembre de 2017, 13:58, Antonio Rodriguez Andres <
>> antoniorodriguezandre...@gmail.com> escribió:
>>
>>> Carlos
>>> He tecleado lo siguiente para leer el fichero de Stata
>>>
>>> library(foreign)
>>> datos = as.data.frame(read.dta("private98-06more_than9.dta"))
>>> save(datos, file="data.RData")
>>> load("data.RData")
>>> dim(datos)
>>> class(datos)
>>>
>>> Tiene ese numero de filas y columnas que son las variables.
>>>
>>>  dim(datos)[1] 9418455  28
>>>
>>> Mi memoria RAM es 4GB, pero he conseguido leer los datos, y tambien
>>> hacer un histograma de age, aunque es dificil ver algo por la cantidad
>>> de individuos que hay en la base de datos.
>>>
>>> hist(datos$age, main="Titulo", xlab="Age")
>>>
>>> Ya cuando intento ver los valores perdidos con
>>>
>>> is.na(datos) me sale error
>>>
>>>
>>> Error: cannot allocate vector of size 1006.0 Mb
>>>
>>> Saludos
>>>
>>>
>>>
>>> 2017-12-06 13:49 GMT+01:00 Carlos Ortega <c...@qualityexcellence.es>:
>>>
>>> > OK.
>>> > Lee primero los datos, guarda el data.frame (.RData o en un .csv o lo
>>> que
>>> > quieras).
>>> > Sal de RStudio o incluso reinicia el ordenador para liberar el máximo
>>> de
>>> > memoria.
>>> >
>>> > Y comienza una nueva sesión con RStudio cargando los datos con
>

Re: [R-es] STATA base de datos

2017-12-06 Thread Antonio Rodriguez Andres
Gracias Carlos. Voy a probar y te digo.

El 6/12/2017 13:49, "Carlos Ortega" <c...@qualityexcellence.es> escribió:

> OK.
> Lee primero los datos, guarda el data.frame (.RData o en un .csv o lo que
> quieras).
> Sal de RStudio o incluso reinicia el ordenador para liberar el máximo de
> memoria.
>
> Y comienza una nueva sesión con RStudio cargando los datos con "fread()".
> Por otro lado, este conjunto de datos ¿cómo es de grande (filas y
> columnas)?.
>
> ¿Y qué máquina tienes?. ¿Cuanta RAM tienes?.
>
> Gracias,
> Carlos.
>
>
> El 6 de diciembre de 2017, 13:42, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
>> Carlos
>>
>> use library foreign, y read.dta. Consegui leer los datos. Pero demora
>> mucho. explore los datos con head y tail, y con summary. Conseguis los
>> resultados. Muy lento. Una cosa a. hacer es un histograma y ahi ya ponia
>> cannot allocate memory.
>>
>> Pense que podria leer los datos de otra manera mas eficiente.
>>
>> El 6/12/2017 13:32, "Carlos Ortega" <c...@qualityexcellence.es> escribió:
>>
>>> Pero entonces, ¿has leído ya el fichero en RStudio? ¿lo has convertido
>>> de Stata a csv o algún otro formato que con el que puedas trabajar en
>>> RStudio?.
>>> ¿O ahora el problema es que has convertido el fichero pero no puedes
>>> hacer ningún tipo de análisis porque tu equipo no tiene suficientes
>>> recursos?...
>>>
>>> Gracias,
>>> Carlos.
>>>
>>> El 6 de diciembre de 2017, 13:09, Antonio Rodriguez Andres <
>>> antoniorodriguezandre...@gmail.com> escribió:
>>>
>>>> He llegado hacer un summary o algo asi. Despues de leerlo pero tarda
>>>> mucho.
>>>> Y si hago un histograma de una variable edad, hay colapsa.
>>>>
>>>> El 6/12/2017 13:05, "Antonio Rodriguez Andres" <
>>>> antoniorodriguezandre...@gmail.com> escribió:
>>>>
>>>> > Freddy
>>>> >
>>>> > el archivo lo leo en segundos en Stata. puedo probar el paquete
>>>> heaven.
>>>> > Pero si recuerdo me dio problemas en RStudio
>>>> >
>>>> > El 6/12/2017 13:03, "Freddy Omar López Quintero" <
>>>> freddy.vat...@gmail.com>
>>>> > escribió:
>>>> >
>>>> >> El mié, 06-12-2017 a las 12:55 +0100, Antonio Rodriguez Andres
>>>> escribió:
>>>> >>
>>>> >> me sale problema
>>>> >> de memoria.
>>>> >>
>>>> >>
>>>> >> Pregunta posiblemente tonta: ¿tienes suficiente memoria para
>>>> procesar un
>>>> >> archivo de tales dimensiones? Puede que ni aún cambiando la manera
>>>> de leer
>>>> >> el archivo realmente lo puedas procesar.
>>>> >>
>>>> >>
>>>> >> Entonces, una solucion es intentar pasar de STATA a CSV y luego usar
>>>> el
>>>> >> comando fread, y finalmente cargar los datos como RData
>>>> >>
>>>> >>
>>>> >> ¿Has probado el paquete haven y específicamente su función read_dta?
>>>> >> Parece que es bastante más eficiente que la de foreign y preserva más
>>>> >> características que trae el formato de stata.
>>>> >>
>>>> >> ¡Ojalá algo sirva!
>>>> >>
>>>> >> ¡Salud!
>>>> >>
>>>> >> --
>>>> >>
>>>> >> «...homines autem hominum causa esse generatos...»
>>>> >>
>>>> >> Cicero
>>>> >>
>>>> >
>>>>
>>>> [[alternative HTML version deleted]]
>>>>
>>>> ___
>>>> R-help-es mailing list
>>>> R-help-es@r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] STATA base de datos

2017-12-06 Thread Antonio Rodriguez Andres
Carlos

use library foreign, y read.dta. Consegui leer los datos. Pero demora
mucho. explore los datos con head y tail, y con summary. Conseguis los
resultados. Muy lento. Una cosa a. hacer es un histograma y ahi ya ponia
cannot allocate memory.

Pense que podria leer los datos de otra manera mas eficiente.

El 6/12/2017 13:32, "Carlos Ortega" <c...@qualityexcellence.es> escribió:

> Pero entonces, ¿has leído ya el fichero en RStudio? ¿lo has convertido de
> Stata a csv o algún otro formato que con el que puedas trabajar en RStudio?.
> ¿O ahora el problema es que has convertido el fichero pero no puedes hacer
> ningún tipo de análisis porque tu equipo no tiene suficientes recursos?...
>
> Gracias,
> Carlos.
>
> El 6 de diciembre de 2017, 13:09, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
>> He llegado hacer un summary o algo asi. Despues de leerlo pero tarda
>> mucho.
>> Y si hago un histograma de una variable edad, hay colapsa.
>>
>> El 6/12/2017 13:05, "Antonio Rodriguez Andres" <
>> antoniorodriguezandre...@gmail.com> escribió:
>>
>> > Freddy
>> >
>> > el archivo lo leo en segundos en Stata. puedo probar el paquete heaven.
>> > Pero si recuerdo me dio problemas en RStudio
>> >
>> > El 6/12/2017 13:03, "Freddy Omar López Quintero" <
>> freddy.vat...@gmail.com>
>> > escribió:
>> >
>> >> El mié, 06-12-2017 a las 12:55 +0100, Antonio Rodriguez Andres
>> escribió:
>> >>
>> >> me sale problema
>> >> de memoria.
>> >>
>> >>
>> >> Pregunta posiblemente tonta: ¿tienes suficiente memoria para procesar
>> un
>> >> archivo de tales dimensiones? Puede que ni aún cambiando la manera de
>> leer
>> >> el archivo realmente lo puedas procesar.
>> >>
>> >>
>> >> Entonces, una solucion es intentar pasar de STATA a CSV y luego usar el
>> >> comando fread, y finalmente cargar los datos como RData
>> >>
>> >>
>> >> ¿Has probado el paquete haven y específicamente su función read_dta?
>> >> Parece que es bastante más eficiente que la de foreign y preserva más
>> >> características que trae el formato de stata.
>> >>
>> >> ¡Ojalá algo sirva!
>> >>
>> >> ¡Salud!
>> >>
>> >> --
>> >>
>> >> «...homines autem hominum causa esse generatos...»
>> >>
>> >> Cicero
>> >>
>> >
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] STATA base de datos

2017-12-06 Thread Antonio Rodriguez Andres
He llegado hacer un summary o algo asi. Despues de leerlo pero tarda mucho.
Y si hago un histograma de una variable edad, hay colapsa.

El 6/12/2017 13:05, "Antonio Rodriguez Andres" <
antoniorodriguezandre...@gmail.com> escribió:

> Freddy
>
> el archivo lo leo en segundos en Stata. puedo probar el paquete heaven.
> Pero si recuerdo me dio problemas en RStudio
>
> El 6/12/2017 13:03, "Freddy Omar López Quintero" <freddy.vat...@gmail.com>
> escribió:
>
>> El mié, 06-12-2017 a las 12:55 +0100, Antonio Rodriguez Andres escribió:
>>
>> me sale problema
>> de memoria.
>>
>>
>> Pregunta posiblemente tonta: ¿tienes suficiente memoria para procesar un
>> archivo de tales dimensiones? Puede que ni aún cambiando la manera de leer
>> el archivo realmente lo puedas procesar.
>>
>>
>> Entonces, una solucion es intentar pasar de STATA a CSV y luego usar el
>> comando fread, y finalmente cargar los datos como RData
>>
>>
>> ¿Has probado el paquete haven y específicamente su función read_dta?
>> Parece que es bastante más eficiente que la de foreign y preserva más
>> características que trae el formato de stata.
>>
>> ¡Ojalá algo sirva!
>>
>> ¡Salud!
>>
>> --
>>
>> «...homines autem hominum causa esse generatos...»
>>
>> Cicero
>>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] STATA base de datos

2017-12-06 Thread Antonio Rodriguez Andres
Freddy

el archivo lo leo en segundos en Stata. puedo probar el paquete heaven.
Pero si recuerdo me dio problemas en RStudio

El 6/12/2017 13:03, "Freddy Omar López Quintero" <freddy.vat...@gmail.com>
escribió:

> El mié, 06-12-2017 a las 12:55 +0100, Antonio Rodriguez Andres escribió:
>
> me sale problema
> de memoria.
>
>
> Pregunta posiblemente tonta: ¿tienes suficiente memoria para procesar un
> archivo de tales dimensiones? Puede que ni aún cambiando la manera de leer
> el archivo realmente lo puedas procesar.
>
>
> Entonces, una solucion es intentar pasar de STATA a CSV y luego usar el
> comando fread, y finalmente cargar los datos como RData
>
>
> ¿Has probado el paquete haven y específicamente su función read_dta?
> Parece que es bastante más eficiente que la de foreign y preserva más
> características que trae el formato de stata.
>
> ¡Ojalá algo sirva!
>
> ¡Salud!
>
> --
>
> «...homines autem hominum causa esse generatos...»
>
> Cicero
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] STATA base de datos

2017-12-06 Thread Antonio Rodriguez Andres
Tengo una base de datos muy grande en formato Stata, (dta), he probado a
leerla con el paquete foreign, y el comando
read.dta, pero como tiene 28 variables y casi medio millon de individuos,
cuando pruebo a hacer graficas o algo, me sale problema
de memoria.

Entonces, una solucion es intentar pasar de STATA a CSV y luego usar el
comando fread, y finalmente cargar los datos como RData.

SIn embargo he intentado

setwd("C:/Users/and0096/Desktop/TREXIMA")
library ('foreign')
write.table(read.dta(file.choose('private98-06more_than9.dta')),
file="output.csv", quote = FALSE, sep = ",")




Pero de esta manera me demora mucho, se queda el computador como colgado,
hay alguna otra manera de hacerlo mas rapida. El fichero de Stata
tiene bastante peso (726, 625 bytes). Solo llego al fichero output.csv.
He instalado el paquete data.table
pero cuando tecleo

datacz = as.data.frame(fread('output.csv'))


Error in fread("output.csv") : could not find function "fread"



Entiendo que algo mal estoy haciendo. Alguna idea mejor de como leer ese
fichero de STATA

Saludos cordiales

Antonio


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ORACLE SQL/ LEER DATOS EN R

2017-12-06 Thread Antonio Rodriguez Andres
Muchas gracias por la ayuda y el consejo

Saludos

2017-12-06 12:31 GMT+01:00 Francisco Rodríguez <fjr...@hotmail.com>:

> Con oracle puedes usar, si tu máquina es de 64bits la librería Roracle que
> va muy bien y no es muy complicada de instalar.
>
>
> Hay que distinguir 2 cosas, cuando accedes a la base de datos y allí haces
> la consulta, eso da igual si lo haces con RODBC o Roracle y cuando cargas
> los datos en tu data.frame, en esta operación, ya no está usando el gestor
> de base de datos sino tu propio R. La velocidad y cantidad de datos que
> puedas cargar dependerá en el segundo paso de tu máquina y del software, es
> aquí donde merece la pena para grandes datos usar Roracle porque debería ir
> mejor.
>
>
> Claramente la limitación la vas a tener ya que al cargar los datos en
> memoria podrá alogar el máximo de RAM de que disponga tu máquina local,
> aunque puede ir consultando por partes
> esto no deja de ser una "chapuza" con la que hay que convivir en R, lo
> ideal aquí sería que conforme vas leyendo escribir en disco duro y liberar
> memoria para seguir leyendo el resto de os datos y así ir por bloques,
> sobre todo si tu data.frame va a pesar más de 20GB (salvo que dispongas de
> un servidor), aquí te las tendrás que ingeniar yo no he visto (salvo que
> alguien conozca algo más) librerías que me permitan hacer esta operación de
> modo lo más optimizado posible, cuando me ha ocurrido esto he tenido que
> montarme alguna función para hacerlo y lógicamente el proceso puede ser
> bastante lento
>
> Por tanto mi recomendación si vas a trabajar con Oracle y si tienes una
> máquina de 64bits es que al menos uses ROracle, funciona bastante bien
>
> Un saludo
>
> Un saludo
> --
> *De:* R-help-es <r-help-es-boun...@r-project.org> en nombre de ismael
> mardomingo <gayo...@hotmail.com>
> *Enviado:* miércoles, 6 de diciembre de 2017 11:12
> *Para:* Antonio Rodriguez Andres; r-help-es
> *Asunto:* Re: [R-es] ORACLE SQL/ LEER DATOS EN R
>
> Yo he accedido sin problemas a bases de datos de Oracle desde R con el
> paquete RODBC. Si tienes tablas muy grandes siempre puedes realizar la
> lectura por partes a trav�s de consultas.
>
>
>
> Para poder acceder he configurado, trabajo con Windows, en Herramientas
> Administrativas -->Or�genes de Datos ODBC (32 o 64 bits seg�n el sistema
> que tengas) un origen de datos a la base de datos Oracle que utilizo para
> conectarme desde R con el paquete RODBC y accedes sin problemas.
>
>
>
> Un saludo,
>
> Ismael
>
>
>
> Enviado desde Correo<https://go.microsoft.com/fwlink/?LinkId=550986> para
> Windows 10
>
>
>
> 
> De: R-help-es <r-help-es-boun...@r-project.org> en nombre de Antonio
> Rodriguez Andres <antoniorodriguezandre...@gmail.com>
> Enviado: Wednesday, December 6, 2017 10:10:19 AM
> Para: r-help-es
> Asunto: [R-es] ORACLE SQL/ LEER DATOS EN R
>
> Estimados usuarios de R
>
> Buenos d�as a todos los usuarios. Estamos intentando abrir una base de
> datos de ORACLE en R. Es una base de datos muy grande con datos inviduales
> sobre empleo de los individuos y sus caracteristicas. He echado un vistazo
> a https://www.r-bloggers.com/connecting-r-to-an-oracle-database/,y
> aparecen algunas instrucciones y el paquete RODBC.
>
> Alguien tiene experiencia con estas bases de datos? donde podria encontrar
> mas informacion? Asumo que otro problema puede ser el problema de memoria
> en el ordenador, al ser una enorme base de datos. Pero esto entiendo que se
> puede solucionar.
>
> Agradeceria cualquier sugerencia o ayuda
>
> Saludos
> Antonio
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> Página de Información de R-help-es
> <https://stat.ethz.ch/mailman/listinfo/r-help-es>
> stat.ethz.ch
> Esta es una lista de correo para solicitar ayuda sobre R en español y se
> entiende como un complemento social a la documentación, libros, etc.
> disponibles sobre R ...
>
>
>
> [[alternative HTML version deleted]]
>
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[R-es] ORACLE SQL/ LEER DATOS EN R

2017-12-06 Thread Antonio Rodriguez Andres
Estimados usuarios de R

Buenos días a todos los usuarios. Estamos intentando abrir una base de
datos de ORACLE en R. Es una base de datos muy grande con datos inviduales
sobre empleo de los individuos y sus caracteristicas. He echado un vistazo
a https://www.r-bloggers.com/connecting-r-to-an-oracle-database/,y
aparecen algunas instrucciones y el paquete RODBC.

Alguien tiene experiencia con estas bases de datos? donde podria encontrar
mas informacion? Asumo que otro problema puede ser el problema de memoria
en el ordenador, al ser una enorme base de datos. Pero esto entiendo que se
puede solucionar.

Agradeceria cualquier sugerencia o ayuda

Saludos
Antonio

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Consejo

2017-09-02 Thread Antonio Rodriguez Andres
Muchas gracias, me recomienda algunos libros para comenzar.

Saludos

El 2/09/2017 3:16 p. m., "Javier Marcuzzi" <javier.ruben.marcu...@gmail.com>
escribió:

> Estimado Antonio Rodriguez Andres
>
>
>
> Comienza por donde quieras, lee un libro general, luego otro sobre un tema
> específico, realiza muchos ejercicios, y luego intente manejar muchos
> datos, de lo contrario quedará enredado con los datos propios y las
> distintas alternativas que tiene R para el mismo fin. Estudie todo lo que
> quiera, pero yo en lo personal una gran cantidad de datos no se la doy a
> una persona en sus inicios, no por incapacidad de esta, sino por el peligro
> de una confusión en el ordenamiento y codificación, en otras palabras, hay
> que asegurar los cimientos del edificio, luego discutir el color de la
> ventana.
>
>
>
> Javier Rubén Marcuzzi
>
>
>
> *De: *Antonio Rodriguez Andres <antoniorodriguezandre...@gmail.com>
> *Enviado: *viernes, 1 de septiembre de 2017 5:28
> *Para: *r-help-es <r-help-es@r-project.org>
> *Asunto: *[R-es] Consejo
>
>
>
> Estimados miembros de la comunidad de R
>
>
>
> Me gustaria conocer dado que estoy trabajando con datos del World Values
>
> Survey, y tengo que recodificar variables y manipularlas,
>
> por donde podria empezar a estudiar el uso de R en grandes surveys. Que
>
> podria comenzar a la leer.
>
> Su respuesta sera bienvenida
>
>
>
> saludos
>
>
>
> Antonio
>
>
>
> --
>
>
>
> Member, Editorial Committee, *The Economic and Labour Relations Review* (a
>
> SAGE journal)
>
>
>
> http://elr.sagepub.com/
>
>
>
> Member, Editorial Committee, African Journal of Economic and Management
>
> Studies
>
>
>
> http://emeraldgrouppublishing.com/products/journals/
> editorial_team.htm?id=ajems
>
>
>
> https://www.researchgate.net/profile/Antonio_Andres (Research Gate
> profile)
>
>
>
> [[alternative HTML version deleted]]
>
>
>
> ___
>
> R-help-es mailing list
>
> R-help-es@r-project.org
>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problema en lectura de datos. Memoria insuficiente

2017-06-27 Thread Antonio Rodriguez Andres
Si he intentado con el paquete haven pero no me lee todos los datos, se me
corta el archivo, después de un tiempo de procesamiento. Te adjunto el
fichero que quiero leer, que es del ESS, es verdad que es muy pesado, y
luego puedo seleccionar un subconjunto de ello

​
 ESS1-7e01.rar
<https://drive.google.com/file/d/0BzjI-OU4De0rdWtubWRocTVnNnc/view?usp=drive_web>
​

2017-06-27 12:37 GMT-05:00 Freddy Omar López Quintero <
freddy.lopez.quint...@gmail.com>:

>
> 2017-06-27 13:12 GMT-04:00 Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com>:
>
>> Que archivo has intentado leer el del VWS o el de la link que te envié?
>
>
> ​Ambos. El del enlace que me enviaste es bastante más pequeño (me tendrías
> que decir qué variables seleccionar para que sean exactamente iguales -o
> enviárnoslo en un enlace drive o dropbox o algo así-). ​
>
> ¡
> ​Salud!​
>
>
> --
> «Pídeles sus títulos a los que te persiguen, pregúntales
> cuándo nacieron, diles que te demuestren su existencia.»
>
> Rafael Cadenas
>
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema en lectura de datos. Memoria insuficiente

2017-06-27 Thread Antonio Rodriguez Andres
Freddy

Que archivo has intentado leer el del VWS o el de la link que te envié?

2017-06-27 11:33 GMT-05:00 Freddy Omar López Quintero <
freddy.lopez.quint...@gmail.com>:

>
> 2017-06-27 11:42 GMT-04:00 Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com>:
>
>> Estaba usando el ESS pero me he dado cuenta que si tiene csv, yo lo bajé
>> de aquí en formato SPSS pero me da el error de falta de memoria
>>
>>
>> http://www.europeansocialsurvey.org/downloadwizard/
>>
>
> ​De acuerdo. He usado la fuente que envías y otra que hallé en
>
> http://www.worldvaluessurvey.org/WVSDocumentationWVL.jsp
>>
>
> ​para descargar algunos datos y tuve inconvenientes para importarlos con
> la función de foreign en su versión stata:
>
> Error in `levels<-`(`*tmp*`, value = if (nl == nL) as.character(labels)
>> else paste0(labels,  :
>>   factor level [31] is duplicated
>>
>
> y con el formato de SPSS:
>
> Error in read.spss() : error reading system-file header
>>
>
> pero no al usar haven, que los leyó aparentemente bien. Sí noté que con el
> archivo .sav tarda bastante más en lanzar el error.
>
> Naturalmente el archivo que es bastante grande (de casi 570MB) requerirá
> mucho más tiempo para la importación (yo reinicié el ordenador para dejarle
> el trabajo único de la importación).
>
> Aventuro finalmente a decir que el problema es únicamente por la capacidad
> del ordenador que utilizas y el esfuerzo que debe hacer la función para
> convertir los datos. ¿Pudiste leer los datos en csv? (¡sería una 'solución'
> feliz!)
>
> Por otro lado, he leído que en Windows se puede usar la función
> memory.limit() para modificar la cantidad de memoria para utilizar (
> https://stackoverflow.com/questions/1395229/increasing-or-d
> ecreasing-the-memory-available-to-r-processes).
>
> ¿Sirven de algo estas divagaciones? jeje.
>
> ¡Salud!​
>
> --
> «Pídeles sus títulos a los que te persiguen, pregúntales
> cuándo nacieron, diles que te demuestren su existencia.»
>
> Rafael Cadenas
>
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema en lectura de datos. Memoria insuficiente

2017-06-27 Thread Antonio Rodriguez Andres
Si de hecho he utilizado el read_spss por el tema de las labels. Pero
obtengo el mismo mensaje de problema de memoria.
Antonio

2017-06-27 10:30 GMT-05:00 Freddy Omar López Quintero <
freddy.lopez.quint...@gmail.com>:

>
> 2017-06-27 11:10 GMT-04:00 Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com>:
>
>> El
>> survey solo tiene los datos en formato SPSS o en formato de STATA (.dta).
>>
>
> ​En el pasado yo he utilizado read_spss y read_dta ​del paquete haven y me
> han funcionado mejor que las funciones de foreign, sobre todo por las
> etiquetas que tanto SPSS y stata ocupan, que al leerse con las clásicas
> funciones desaparecen. ¿Has probado estas funciones?
>
> ¡​Salud!​
>
> --
> «Pídeles sus títulos a los que te persiguen, pregúntales
> cuándo nacieron, diles que te demuestren su existencia.»
>
> Rafael Cadenas
>
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema en lectura de datos. Memoria insuficiente

2017-06-27 Thread Antonio Rodriguez Andres
Gracias Eric

Actualmente no tengo SPSS instalado en mi computador ni tengo licencia. El
survey solo tiene los datos en formato SPSS o en formato de STATA (.dta).
Creo que estos últimos se pueden leer con read.dta, de la library(foreign).
Pero entiendo que darán el mismo problema

2017-06-26 17:08 GMT-05:00 eric <ericconchamu...@gmail.com>:

> Hola antonio, cuando tengo que leer datos de SPSS no lo hago directamente
> con R porque nunca me resulta muy bien (no es que sea un problema de R, es
> que yo no se como hacerlo bien). En lugar de eso transformo los datos a
> csv, como te sugiere Francisco, usando "pspp-convert"que viene con el
> paquete "pspp" para linux. Asi obtengo un archivo bastante bien terminado
> que puedo leer directamente en R. Si estas en windows entonces puedes
> guardar los datos directamente en csv con SPSS.
>
> Espero que te ayude, saludos !!
>
> Eric.
>
>
>
>
> On 06/24/2017 09:24 AM, Antonio Rodriguez Andres wrote:
>
> Buenos días
>
> Estoy intentando leer una base de datos correspondiente al World Values
> Survey desde 1981 a 2014. Contiene variables por columnas, y observaciones
> correspondientes a individuos
> de diferentes países. Podría tener como aprox. 1000 variables, y mas de
> 60,000 individuos por año. Esta es la información que obtengo de mi RStudio.
>
>
> sessionInfo()R version 3.3.2 (2016-10-31)
>
> Platform: x86_64-w64-mingw32/x64 (64-bit)
> Running under: Windows >= 8 x64 (build 9200)
>
>
> El ordenador portatil tiene las siguientes especificaciones, RAM INSTALADO
> : 4GB
>
>
> Cuando intento leer el data frame, lo que obtengo es ese mensaje de error.
> He intentado cambiar el memory limit, pero no consigo leerlo.
>
>
> vws = read_spss("WVS_Longitudinal_1981_2014_spss_v2015_04_18.sav")Error: 
> cannot allocate vector of size 2.6 Mb
>
> Alguna sugerencia de como podría leer los datos.
>
>
>
> Gracias por anticipado
>
> Antonio
>
>
>
> --
>
>   [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing 
> listR-help-es@r-project.orghttps://stat.ethz.ch/mailman/listinfo/r-help-es
> .
>
>
>
> --
> Forest Engineer
> Master in Environmental and Natural Resource Economics
> Ph.D. student in Sciences of Natural Resources at La Frontera University
> Member in AguaDeTemu2030, citizen movement for Temuco with green city 
> standards for living
>
> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos 
> lectores de correo.
>
>


-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problema en lectura de datos. Memoria insuficiente

2017-06-24 Thread Antonio Rodriguez Andres
Francisco

Uno de los ficheros de 1981 a 2014 esta en formato rdata, y el otro está en
formato SPSS o STATA. Creo que lo que dices solo vale para ficheros txt, o
csv. Mi idea es luego combinarlos mediante rbind ambos datos, lo mismo que
hace el comando append en STATA.

Gracias

2017-06-24 9:08 GMT-05:00 Francisco Rodríguez <fjr...@hotmail.com>:

> Puedes cambiar el formato de datos?  Pásalo a txt o csv y usa la librería
> data.table No sé si data.table permite leer directamente de spss. Un
> saludo
>
> Enviado desde mi smartphone Sony Xperia™
>
>
>  Antonio Rodriguez Andres escribió 
>
> Buenos días
>
> Estoy intentando leer una base de datos correspondiente al World Values
> Survey desde 1981 a 2014. Contiene variables por columnas, y observaciones
> correspondientes a individuos
> de diferentes países. Podría tener como aprox. 1000 variables, y mas de
> 60,000 individuos por año. Esta es la información que obtengo de mi
> RStudio.
>
> > sessionInfo()R version 3.3.2 (2016-10-31)
> Platform: x86_64-w64-mingw32/x64 (64-bit)
> Running under: Windows >= 8 x64 (build 9200)
>
>
> El ordenador portatil tiene las siguientes especificaciones, RAM INSTALADO
> : 4GB
>
>
> Cuando intento leer el data frame, lo que obtengo es ese mensaje de error.
> He intentado cambiar el memory limit, pero no consigo leerlo.
>
> > vws = read_spss("WVS_Longitudinal_1981_2014_spss_v2015_04_18.sav")Error:
> cannot allocate vector of size 2.6 Mb
>
> Alguna sugerencia de como podría leer los datos.
>
>
>
> Gracias por anticipado
>
> Antonio
>
>
>
> --
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 

Member, Editorial Committee, *The Economic and Labour Relations Review* (a
SAGE journal)

http://elr.sagepub.com/

Member, Editorial Committee, African Journal of Economic and Management
Studies

http://emeraldgrouppublishing.com/products/journals/editorial_team.htm?id=ajems

https://www.researchgate.net/profile/Antonio_Andres (Research Gate profile)

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[R-es] Problema en lectura de datos. Memoria insuficiente

2017-06-24 Thread Antonio Rodriguez Andres
Buenos días

Estoy intentando leer una base de datos correspondiente al World Values
Survey desde 1981 a 2014. Contiene variables por columnas, y observaciones
correspondientes a individuos
de diferentes países. Podría tener como aprox. 1000 variables, y mas de
60,000 individuos por año. Esta es la información que obtengo de mi RStudio.

> sessionInfo()R version 3.3.2 (2016-10-31)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)


El ordenador portatil tiene las siguientes especificaciones, RAM INSTALADO
: 4GB


Cuando intento leer el data frame, lo que obtengo es ese mensaje de error.
He intentado cambiar el memory limit, pero no consigo leerlo.

> vws = read_spss("WVS_Longitudinal_1981_2014_spss_v2015_04_18.sav")Error: 
> cannot allocate vector of size 2.6 Mb

Alguna sugerencia de como podría leer los datos.



Gracias por anticipado

Antonio



--

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-18 Thread Antonio Rodriguez Andres
Muchas gracias. Me puede recomendar algún libro donde poder empezar.

Gracias

El 18/06/2017 9:46 p. m., <javier.ruben.marcu...@gmail.com> escribió:

>
>
> Estimado Antonio Rodriguez Andres
>
>
>
> Usted dice que está en sus inicios con R, y desea realizar un gráfico.
> Esto no es problema, el inconveniente es que está mezclando librerías, es
> lógico, se puede y facilita el trabajo, pero como usted no tiene la
> experiencia necesaria está mezclando conceptos y formas de trabajo
> distintas.
>
>
>
> Le recomiendo que pare, busque un ejemplo o un libro de R donde hay algo
> semejante a lo que usted desea, realiza unos ejercicios y comienza otra vez.
>
>
>
> Por ejemplo ggplot2 tiene algunos efectos gráficos de presentación
> vistosos, pero la forma de trabajo requiere conocer algo más el lenguaje,
> si intenta lo mismo pero con solo los paquetes básicos comprenderá cómo se
> realizan los cálculos, algo de trabajo con datos, algunas alternativas para
> realizar el mismo trabajo de distinta forma, y luego busca utilizar ggplot2
> como pretende ahora. Creo que las posibilidades de obtener mejores
> resultados se incrementan si ahora se frena y puede replantear el problema
> en su mente.
>
>
>
> Espere, descanse, el lunes comienza otra vez desde cero y el martes
> regresa a su problema, invertirá mejor su tiempo con R si aumenta el manejo
> de lo básico (antes de usar varias librerías o alternativas que aparecieron
> como sugerencias a su pregunta).
>
>
>
> Javier Rubén Marcuzzi
>
>
>
> *De: *Antonio Rodriguez Andres <antoniorodriguezandre...@gmail.com>
> *Enviado: *domingo, 18 de junio de 2017 21:20
> *Para: *Carlos J. Gil Bellosta <c...@datanalytics.com>
> *CC: *r-help-es <r-help-es@r-project.org>
> *Asunto: *Re: [R-es] Problema con Histograma con porcentajes usando ggplot
>
>
>
> Creo que esto me da para DK, y luego veré como aplicar el barplot
>
> ess   %>%
>   filter(cntry %in% c("DK")) %>%
> count (stflife) %>%
> mutate (freq = (n /sum(n)*100))%>%
> print
>
>
>
> 2017-06-18 19:01 GMT-05:00 Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com>:
>
> He conseguido el total para un país, pero no me deja usar percent =
> count() /sum(count), alguna idea, entiendo que puedo esar la misma sintaxis
> para el barplot
>
> ess   %>%
>   filter(cntry %in% c("DK")) %>%
> count (stflife) %>%
> print
>
>
>
> 2017-06-18 18:07 GMT-05:00 Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com>:
>
> #Simple table con frecuencias absolutas y crear relativas
>
> count =table(ess$stflife)
> percent = 100* (count)/sum(count)
>
> Carlos he creado a esto a nivel general en vez de usar prop.table. Según
> lo que dices o entiendo, debo de usar la función
>
> ddply para hacerlo a nivel de todos los paises, y entiendo que ddply (,
> c(""), debo de indicar los paises?
>
> Saludos
>
>
>
> 2017-06-18 17:37 GMT-05:00 Carlos J. Gil Bellosta <c...@datanalytics.com>:
>
> 1) Agrega por país y nivel (en freq).
>
> 2) Por país, haz algo así como pct = 100 * freq / sum(freq).
>
>
>
> Con plyr, dos líneas.
>
>
>
> El 19 de junio de 2017, 0:20, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
> Gracias. Alguna idea de que usar para calcular los porcentajes y
> almacenarlos. Se puede usar flat table?
>
>
>
> El 18/06/2017 4:50 p. m., "Carlos J. Gil Bellosta" <c...@datanalytics.com>
> escribió:
>
> Los porcentajes que obtienes con tu código son sobre todas las facetas, no
> país a país.
>
>
>
> Calcula los porcentajes previamente a por país y representa esa columna en
> las barras.
>
>
>
> Un saludo,
>
>
>
> Carlos J. Gil Bellosta
>
> http://www.datanalytics.com
>
>
>
>
>
>
>
> El 18 de junio de 2017, 18:23, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
> Estimados
>
> Soy un nuevo usario de R, y estoy usando como base de datos el European
> Social Survey, que tiene datos de 40,000 individuos, y alrededor de 23
> países europeos. Lo que he seleccionado es la útima  ola, el round 7, para
> el año 2014.
>
> He leido los datos, desde SPSS y aquí tienen la base de datos y que tipo
> de objetos se han generado, y tambíen la distribución por pais de la
> muestra. No he usado los weights del survey todavía, solo estoy explorando
> los datos.
>
> class(ess)
>
> ## [1] "lbl_df" "data.frame"
>
> frq(ess$cntry)
>
> ## # Country
> ##
> ##  val 

Re: [R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-18 Thread Antonio Rodriguez Andres
#Simple table con frecuencias absolutas y crear relativas

count =table(ess$stflife)
percent = 100* (count)/sum(count)

Carlos he creado a esto a nivel general en vez de usar prop.table. Según lo
que dices o entiendo, debo de usar la función
ddply para hacerlo a nivel de todos los paises, y entiendo que ddply (,
c(""), debo de indicar los paises?
Saludos

2017-06-18 17:37 GMT-05:00 Carlos J. Gil Bellosta <c...@datanalytics.com>:

> 1) Agrega por país y nivel (en freq).
> 2) Por país, haz algo así como pct = 100 * freq / sum(freq).
>
> Con plyr, dos líneas.
>
> El 19 de junio de 2017, 0:20, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
>> Gracias. Alguna idea de que usar para calcular los porcentajes y
>> almacenarlos. Se puede usar flat table?
>>
>> El 18/06/2017 4:50 p. m., "Carlos J. Gil Bellosta" <c...@datanalytics.com>
>> escribió:
>>
>>> Los porcentajes que obtienes con tu código son sobre todas las facetas,
>>> no país a país.
>>>
>>> Calcula los porcentajes previamente a por país y representa esa columna
>>> en las barras.
>>>
>>> Un saludo,
>>>
>>> Carlos J. Gil Bellosta
>>> http://www.datanalytics.com
>>>
>>>
>>>
>>> El 18 de junio de 2017, 18:23, Antonio Rodriguez Andres <
>>> antoniorodriguezandre...@gmail.com> escribió:
>>>
>>>> Estimados
>>>>
>>>> Soy un nuevo usario de R, y estoy usando como base de datos el European
>>>> Social Survey, que tiene datos de 40,000 individuos, y alrededor de 23
>>>> países europeos. Lo que he seleccionado es la útima  ola, el round 7, para
>>>> el año 2014.
>>>>
>>>> He leido los datos, desde SPSS y aquí tienen la base de datos y que
>>>> tipo de objetos se han generado, y tambíen la distribución por pais de la
>>>> muestra. No he usado los weights del survey todavía, solo estoy explorando
>>>> los datos.
>>>>
>>>> class(ess)
>>>>
>>>> ## [1] "lbl_df" "data.frame"
>>>>
>>>> frq(ess$cntry)
>>>>
>>>> ## # Country
>>>> ##
>>>> ##  val  label  frq raw.prc valid.prc cum.prc
>>>> ##1Austria 17954.47  4.474.47
>>>> ##2Belgium 17694.40  4.408.87
>>>> ##3Switzerland 15323.81  3.81   12.68
>>>> ##4 Czech Republic 21485.35  5.35   18.03
>>>> ##5Germany 30457.58  7.58   25.60
>>>> ##6Denmark 15023.74  3.74   29.34
>>>> ##7Estonia 20515.10  5.10   34.45
>>>> ##8  Spain 19254.79  4.79   39.24
>>>> ##9Finland 20875.19  5.19   44.43
>>>> ##   10 France 19174.77  4.77   49.20
>>>> ##   11 United Kingdom 22645.63  5.63   54.83
>>>> ##   12Hungary 16984.23  4.23   59.06
>>>> ##   13Ireland 23905.95  5.95   65.01
>>>> ##   14 Israel 25626.38  6.38   71.38
>>>> ##   15  Lithuania 22505.60  5.60   76.98
>>>> ##   16Netherlands 19194.78  4.78   81.76
>>>> ##   17 Norway 14363.57  3.57   85.33
>>>> ##   18 Poland 16154.02  4.02   89.35
>>>> ##   19   Portugal 12653.15  3.15   92.50
>>>> ##   20 Sweden 17914.46  4.46   96.95
>>>> ##   21   Slovenia 12243.05  3.05  100.00
>>>> ##   NA NA00.00NA  NA
>>>> Ahora voy a hacer un histograma de la variable satisfaccion con la
>>>> vida,  cuyo rango es de 0-10 (numeros enteros, donde mayor valor indica
>>>> mayor satisfacción con la vida.
>>>>
>>>> get_labels(ess$stflife)
>>>>
>>>>
>>>> ##  [1] "Extremely dissatisfied" "1"
>>>> ##  [3] "2"  "3"
>>>> ##  [5] "4"  "5"
>>>> ##  [7] "6"  "7"
>>>> ##  [9] "8"  "9"
>>>> ## [11] "Extremely satisfied""Refusal"
>>>>
>>>> ## [13] "Don't know" "No answer"
>>>>
>>>> Lo que he hecho es hac

Re: [R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-18 Thread Antonio Rodriguez Andres
Gracias. Voy a estudiarlo. Soy neófito y me llevará algún tiempo.

El 18/06/2017 5:37 p. m., "Carlos J. Gil Bellosta" <c...@datanalytics.com>
escribió:

> 1) Agrega por país y nivel (en freq).
> 2) Por país, haz algo así como pct = 100 * freq / sum(freq).
>
> Con plyr, dos líneas.
>
> El 19 de junio de 2017, 0:20, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
>> Gracias. Alguna idea de que usar para calcular los porcentajes y
>> almacenarlos. Se puede usar flat table?
>>
>> El 18/06/2017 4:50 p. m., "Carlos J. Gil Bellosta" <c...@datanalytics.com>
>> escribió:
>>
>>> Los porcentajes que obtienes con tu código son sobre todas las facetas,
>>> no país a país.
>>>
>>> Calcula los porcentajes previamente a por país y representa esa columna
>>> en las barras.
>>>
>>> Un saludo,
>>>
>>> Carlos J. Gil Bellosta
>>> http://www.datanalytics.com
>>>
>>>
>>>
>>> El 18 de junio de 2017, 18:23, Antonio Rodriguez Andres <
>>> antoniorodriguezandre...@gmail.com> escribió:
>>>
>>>> Estimados
>>>>
>>>> Soy un nuevo usario de R, y estoy usando como base de datos el European
>>>> Social Survey, que tiene datos de 40,000 individuos, y alrededor de 23
>>>> países europeos. Lo que he seleccionado es la útima  ola, el round 7, para
>>>> el año 2014.
>>>>
>>>> He leido los datos, desde SPSS y aquí tienen la base de datos y que
>>>> tipo de objetos se han generado, y tambíen la distribución por pais de la
>>>> muestra. No he usado los weights del survey todavía, solo estoy explorando
>>>> los datos.
>>>>
>>>> class(ess)
>>>>
>>>> ## [1] "lbl_df" "data.frame"
>>>>
>>>> frq(ess$cntry)
>>>>
>>>> ## # Country
>>>> ##
>>>> ##  val  label  frq raw.prc valid.prc cum.prc
>>>> ##1Austria 17954.47  4.474.47
>>>> ##2Belgium 17694.40  4.408.87
>>>> ##3Switzerland 15323.81  3.81   12.68
>>>> ##4 Czech Republic 21485.35  5.35   18.03
>>>> ##5Germany 30457.58  7.58   25.60
>>>> ##6Denmark 15023.74  3.74   29.34
>>>> ##7Estonia 20515.10  5.10   34.45
>>>> ##8  Spain 19254.79  4.79   39.24
>>>> ##9Finland 20875.19  5.19   44.43
>>>> ##   10 France 19174.77  4.77   49.20
>>>> ##   11 United Kingdom 22645.63  5.63   54.83
>>>> ##   12Hungary 16984.23  4.23   59.06
>>>> ##   13Ireland 23905.95  5.95   65.01
>>>> ##   14 Israel 25626.38  6.38   71.38
>>>> ##   15  Lithuania 22505.60  5.60   76.98
>>>> ##   16Netherlands 19194.78  4.78   81.76
>>>> ##   17 Norway 14363.57  3.57   85.33
>>>> ##   18 Poland 16154.02  4.02   89.35
>>>> ##   19   Portugal 12653.15  3.15   92.50
>>>> ##   20 Sweden 17914.46  4.46   96.95
>>>> ##   21   Slovenia 12243.05  3.05  100.00
>>>> ##   NA NA00.00NA  NA
>>>> Ahora voy a hacer un histograma de la variable satisfaccion con la
>>>> vida,  cuyo rango es de 0-10 (numeros enteros, donde mayor valor indica
>>>> mayor satisfacción con la vida.
>>>>
>>>> get_labels(ess$stflife)
>>>>
>>>>
>>>> ##  [1] "Extremely dissatisfied" "1"
>>>> ##  [3] "2"  "3"
>>>> ##  [5] "4"  "5"
>>>> ##  [7] "6"  "7"
>>>> ##  [9] "8"  "9"
>>>> ## [11] "Extremely satisfied""Refusal"
>>>>
>>>> ## [13] "Don't know" "No answer"
>>>>
>>>> Lo que he hecho es hacer una tabla de la distribución de esa variable
>>>> para un sólo pais Dinamarca (DK)
>>>>
>>>> flat_table(subset(ess, cntry %in% c("DK")), stflife, margin= "row")
>>>>
>>>> ## x 0 1 2 3 4 5 6 7 8 910
>>>> ##
>>>>
>>>> ##0.33  0.27  0.47  1.33  0.93  2.87  3.67  8.20 28.40 29.53 24.00
>>>>
>>>>
>>>> Sin embargo al hacer un histrogama para los paises con ggplot, anda
>>>> algo mal con los porcentajes. Por ejemplo sabemos que un 24 % respondió que
>>>> están muy satisfechos en DK. Sin embargo
>>>>
>>>> los porcentajes son muy pequeños.
>>>>
>>>>
>>>> myplot = ggplot(ess, aes (stflife)) +
>>>>   geom_bar(aes(y = (..count..)/sum(..count..))) +
>>>>   scale_y_continuous(labels=scales::percent) +
>>>>   ylab("Relative frequencies") + facet_wrap(~cntry)
>>>>
>>>> plot(myplot)
>>>>
>>>> [image: Inline images 1]
>>>>
>>>>
>>>> ___
>>>> R-help-es mailing list
>>>> R-help-es@r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-18 Thread Antonio Rodriguez Andres
Gracias. Alguna idea de que usar para calcular los porcentajes y
almacenarlos. Se puede usar flat table?

El 18/06/2017 4:50 p. m., "Carlos J. Gil Bellosta" <c...@datanalytics.com>
escribió:

> Los porcentajes que obtienes con tu código son sobre todas las facetas, no
> país a país.
>
> Calcula los porcentajes previamente a por país y representa esa columna en
> las barras.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
>
> El 18 de junio de 2017, 18:23, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
>> Estimados
>>
>> Soy un nuevo usario de R, y estoy usando como base de datos el European
>> Social Survey, que tiene datos de 40,000 individuos, y alrededor de 23
>> países europeos. Lo que he seleccionado es la útima  ola, el round 7, para
>> el año 2014.
>>
>> He leido los datos, desde SPSS y aquí tienen la base de datos y que tipo
>> de objetos se han generado, y tambíen la distribución por pais de la
>> muestra. No he usado los weights del survey todavía, solo estoy explorando
>> los datos.
>>
>> class(ess)
>>
>> ## [1] "lbl_df" "data.frame"
>>
>> frq(ess$cntry)
>>
>> ## # Country
>> ##
>> ##  val  label  frq raw.prc valid.prc cum.prc
>> ##1Austria 17954.47  4.474.47
>> ##2Belgium 17694.40  4.408.87
>> ##3Switzerland 15323.81  3.81   12.68
>> ##4 Czech Republic 21485.35  5.35   18.03
>> ##5Germany 30457.58  7.58   25.60
>> ##6Denmark 15023.74  3.74   29.34
>> ##7Estonia 20515.10  5.10   34.45
>> ##8  Spain 19254.79  4.79   39.24
>> ##9Finland 20875.19  5.19   44.43
>> ##   10 France 19174.77  4.77   49.20
>> ##   11 United Kingdom 22645.63  5.63   54.83
>> ##   12Hungary 16984.23  4.23   59.06
>> ##   13Ireland 23905.95  5.95   65.01
>> ##   14 Israel 25626.38  6.38   71.38
>> ##   15  Lithuania 22505.60  5.60   76.98
>> ##   16Netherlands 19194.78  4.78   81.76
>> ##   17 Norway 14363.57  3.57   85.33
>> ##   18 Poland 16154.02  4.02   89.35
>> ##   19   Portugal 12653.15  3.15   92.50
>> ##   20 Sweden 17914.46  4.46   96.95
>> ##   21   Slovenia 12243.05  3.05  100.00
>> ##   NA NA00.00NA  NA
>> Ahora voy a hacer un histograma de la variable satisfaccion con la vida,
>> cuyo rango es de 0-10 (numeros enteros, donde mayor valor indica mayor
>> satisfacción con la vida.
>>
>> get_labels(ess$stflife)
>>
>>
>> ##  [1] "Extremely dissatisfied" "1"
>> ##  [3] "2"  "3"
>> ##  [5] "4"  "5"
>> ##  [7] "6"  "7"
>> ##  [9] "8"  "9"
>> ## [11] "Extremely satisfied""Refusal"
>>
>> ## [13] "Don't know" "No answer"
>>
>> Lo que he hecho es hacer una tabla de la distribución de esa variable
>> para un sólo pais Dinamarca (DK)
>>
>> flat_table(subset(ess, cntry %in% c("DK")), stflife, margin= "row")
>>
>> ## x 0 1 2 3 4 5 6 7 8 910
>> ##
>>
>> ##0.33  0.27  0.47  1.33  0.93  2.87  3.67  8.20 28.40 29.53 24.00
>>
>>
>> Sin embargo al hacer un histrogama para los paises con ggplot, anda algo
>> mal con los porcentajes. Por ejemplo sabemos que un 24 % respondió que
>> están muy satisfechos en DK. Sin embargo
>>
>> los porcentajes son muy pequeños.
>>
>>
>> myplot = ggplot(ess, aes (stflife)) +
>>   geom_bar(aes(y = (..count..)/sum(..count..))) +
>>   scale_y_continuous(labels=scales::percent) +
>>   ylab("Relative frequencies") + facet_wrap(~cntry)
>>
>> plot(myplot)
>>
>> [image: Inline images 1]
>>
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-18 Thread Antonio Rodriguez Andres
Estimados

Soy un nuevo usario de R, y estoy usando como base de datos el European
Social Survey, que tiene datos de 40,000 individuos, y alrededor de 23
países europeos. Lo que he seleccionado es la útima  ola, el round 7, para
el año 2014.

He leido los datos, desde SPSS y aquí tienen la base de datos y que tipo de
objetos se han generado, y tambíen la distribución por pais de la muestra.
No he usado los weights del survey todavía, solo estoy explorando los datos.

class(ess)

## [1] "lbl_df" "data.frame"

frq(ess$cntry)

## # Country
##
##  val  label  frq raw.prc valid.prc cum.prc
##1Austria 17954.47  4.474.47
##2Belgium 17694.40  4.408.87
##3Switzerland 15323.81  3.81   12.68
##4 Czech Republic 21485.35  5.35   18.03
##5Germany 30457.58  7.58   25.60
##6Denmark 15023.74  3.74   29.34
##7Estonia 20515.10  5.10   34.45
##8  Spain 19254.79  4.79   39.24
##9Finland 20875.19  5.19   44.43
##   10 France 19174.77  4.77   49.20
##   11 United Kingdom 22645.63  5.63   54.83
##   12Hungary 16984.23  4.23   59.06
##   13Ireland 23905.95  5.95   65.01
##   14 Israel 25626.38  6.38   71.38
##   15  Lithuania 22505.60  5.60   76.98
##   16Netherlands 19194.78  4.78   81.76
##   17 Norway 14363.57  3.57   85.33
##   18 Poland 16154.02  4.02   89.35
##   19   Portugal 12653.15  3.15   92.50
##   20 Sweden 17914.46  4.46   96.95
##   21   Slovenia 12243.05  3.05  100.00
##   NA NA00.00NA  NA
Ahora voy a hacer un histograma de la variable satisfaccion con la vida,
cuyo rango es de 0-10 (numeros enteros, donde mayor valor indica mayor
satisfacción con la vida.

get_labels(ess$stflife)


##  [1] "Extremely dissatisfied" "1"
##  [3] "2"  "3"
##  [5] "4"  "5"
##  [7] "6"  "7"
##  [9] "8"  "9"
## [11] "Extremely satisfied""Refusal"

## [13] "Don't know" "No answer"

Lo que he hecho es hacer una tabla de la distribución de esa variable para
un sólo pais Dinamarca (DK)

flat_table(subset(ess, cntry %in% c("DK")), stflife, margin= "row")

## x 0 1 2 3 4 5 6 7 8 910
##

##0.33  0.27  0.47  1.33  0.93  2.87  3.67  8.20 28.40 29.53 24.00


Sin embargo al hacer un histrogama para los paises con ggplot, anda algo
mal con los porcentajes. Por ejemplo sabemos que un 24 % respondió que
están muy satisfechos en DK. Sin embargo

los porcentajes son muy pequeños.


myplot = ggplot(ess, aes (stflife)) +
  geom_bar(aes(y = (..count..)/sum(..count..))) +
  scale_y_continuous(labels=scales::percent) +
  ylab("Relative frequencies") + facet_wrap(~cntry)

plot(myplot)

[image: Inline images 1]
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es