Re: [R-es] Fwd: weighted random forest

2021-01-23 Por tema Jose Luis Cañadas Reche
Hola. Si tienes una columna con los pesos. con tidyverse es sencillo
hacer la muestra usando


tam_muestra <- 1000

muestra <- df %>%
  sample_n(size = tam_muestra,
   replace = TRUE,
   weight = pesos)



El 22/1/21 a las 17:58, Manuel Mendoza escribió:
> Gracias Jesús, sí, haré remuestreos. Yo suelo usar una función que me pasó
> un colega:
>
> # A function to generate the equal number of samples (n) for different
> classes
>
> bsample <- function(data,cname,n) {
>   d <- data[-c(1:nrow(data)),]
>   u <- unique(data[,cname])
>   for (uu in u) {
> w <- which(data[,cname] == uu)
> if (length(w) >= n) {
>   s <- sample(w,n)
> } else {
>   s <- sample(w,n,replace=TRUE)
> }
> d <- rbind(d,data[s,])
>   }
>   d
> }
>
> # for your data:
> table(data$Clst)
> mean<-mean(table(data$Clst))
> data <- bsample(data,'Clst',mean) # this takes 100 records for each class
> in your dataset
> table(data$Clst)
>
> Por si le sirve a alguien, Clst sería la variable objetivo.
> En vez de  bsample(data,'Clst',mean) se puede, p.e.,  (data,'Clst', *2**mean)
>
>
> Manuel
>
> El vie, 22 ene 2021 a las 16:10, Jesús Para Fernández (<
> j.para.fernan...@hotmail.com>) escribió:
>
>> Has probado en usar en vez de algoritmos sensibles al coste, usar técnicas
>> de remuestreo? Hay un paquete de la UGR llamado imbalance que funciona muy
>> bien.
>>
>>
>> --
>> *De:* R-help-es  en nombre de Manuel
>> Mendoza 
>> *Enviado:* viernes, 22 de enero de 2021 11:43
>> *Para:* Lista R 
>> *Asunto:* [R-es] weighted random forest
>>
>> Buenos días, tengo una base de datos desequilibrados (unbalanced) en la que
>> las ausencias son 9 veces más abundantes que las presencias (*ratio *= 9).
>> Para árboles de clasificación utilizo una matriz de pérdidas
>> parms=list(loss=matrix(c(0,
>> FP,  *ratio  *,0)))o un vector de ponderación que le da 9 veces más peso a
>> las presencias. Como cabría esperar, la sensibilidad y sensitividad se
>> hacen parecidas. Pasan de ser
>> 89/39 a 79/76 y kappa sube de 0.24 a 0.30.
>>
>> El problema surge cuando intento hacer lo mismo con random forest, y
>> supongo que no lo estoy haciendo bien. Uso  RFfit <- randomForest(Dep ~. ,
>> classwt = c(1, *ratio * ), data=data). La sensibilidad y sensitividad se
>> quedan casi igual 90/40 y kappa también 0.25.
>>
>> Sé que se puede hacer con ranger, pero, por razones que no vienen al caso,
>> no me viene bien cambiar.
>>
>> Gracias, como siempre,
>> Manuel
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>   [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] De R a pyspark

2020-07-14 Por tema Jose Luis Cañadas Reche
Hola.

En cualquier manual de pyspark viene como hacer un filter y un
withcolumn. te recomiendo el libro de Bill Chambers y Matehi Zaharia .
Spark the definitive Guide. Aunque esto es una lista de R, jejej, así
que te recomiendo encarecidamente el Mastering Spark with R de Javier
Luraschi y Kevin Kuo. (está disponible online).

El 16/6/20 a las 23:50, Samura . escribió:
> Hola,
>
> alguien sabr�a decirme como "traducir" este c�digo de R a c�digo Spark con 
> Python (pyspark)
>
> para rellenar los valores nulos de una columna con los valores de otra.
>
> idx <- which(is.na(df$columna3))
>
> df[idx, 'columna3'] <- df[idx, 'columna4']
>
> Muchas gracias!
>
>
>   [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problema con Histograma con porcentajes usando ggplot

2017-06-19 Por tema Jose Luis Cañadas Reche

Hola a todos.

Utilizando la sintaxis de dplyr (¿ya nadie usa tapply, ni aggregate, ni 
doby??), creo que buscas algo así, agrupando por país y por stlife..



ess_agrupado <- ess %>% group_by(cntry,stflife) %>%
summarise (n = n()) %>%
mutate(freq = n / sum(n))


ggplot(ess_agrupado, aes (x=as.factor(stflife))) +
geom_bar(aes(y = freq), stat="identity") +
scale_y_continuous(labels=scales::percent) +
ylab("Relative frequencies") + facet_wrap(~cntry)


Saludos


El 19/06/17 a las 06:37, Freddy Omar López Quintero escribió:

2017-06-18 23:28 GMT-04:00 Antonio Rodriguez Andres <
antoniorodriguezandre...@gmail.com>:


Me puede recomendar algún libro donde poder empezar.


​De ggplot2, sin duda el libro de su (¿cismático?) creador es una
referencia obligada:

Wickham: ggplot2 Elegant Graphics for Data Analysis, 2016​
y uno muy bueno de

Chang: R Graphics Cookbook, 2012
¡
​Salud!​




___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[R-es] pasar argumentos de consola a un script de R que contiene source

2016-10-29 Por tema Jose Luis Cañadas Reche

Hola.

Tengo un script con la siguiente estructura.

#!/usr/bin/env Rscript
args = commandArgs(trailingOnly=TRUE)

source("carga-datos.R")

source("modelo.R")


y quiero llamar a mi script desde consola con

Rscript --vanilla miscript.R datos1.csv

De forma que se guarde como argumento el nombre del fichero que quiero 
cargar y se pase a al script carga-datos.R. El problema es que aunque si 
guarda datos1.csv en el objeto args , parece que "carga-datos.R" no lo 
ve, no sé si es que no está en el global environment. ¿Alguna idea de 
cómo resolverlo? Gracias.



Un saludo.

José Luis Cañadas

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Gráficos con apply

2016-06-03 Por tema Jose Luis Cañadas Reche

Hola.
También puedes probar con

lapply(names(datos),function(x){plot(datos[,x],col=8,main=x, ylab="")})


El 02/06/16 a las 18:59, Carlos Ortega escribió:

Hola,

En vez de "names(x)", pon "colnames(x)"...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 2 de junio de 2016, 18:23, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:


Buenas

Quiero crear 8 histogramas. Hasta ahora los hacia con el bucle for, y
ahora quiero hacerlos con apply para ver como se haria.

Para ello, tengo un data.frame, llamado datos, con 8 variables, v1,v2

Con el for hacía

par(mfrow=c(4,2))
for(i in 1:8){
plot(datos[,i],main=names(datos[i]))
}
y obtenia el grafico con el titulo de cada variable.

Al intentar hacer lo mismo con el apply, lo que no consigo es poner el
titulo de cada variable

apply(datos,2,function(x){c(plot(x,col=8,main=names(x)))})

¿Alguna idea??

Gracias de nuevo!!!

 [[alternative HTML version deleted]]


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es






___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Paquete calculo de tamaño muestral

2016-05-22 Por tema Jose Luis Cañadas Reche

Hola.
Pues hay unos cuantos. Yo le echaría un vistazo a los paquetes 
"samplingbook" con algunas funciones para el cálculo del tamaño 
muestral, por ejemplo para calcular el tamaño muestral total en muestreo 
estratificado y el tamaño muestral en cada estrato.


También miraría la librería "sampling" que viene muy bien para realizar 
el muestreo en diseños complejos. Es decir, partiendo del marco, te 
permite obtener la muestra incluso en diseños de varias etapas.


Y una muy útil para obtener estimaciones correctas a partir de muestras 
complejas es la librería "survey", que incluso algunos modelos como los 
glm y tal, de forma qeu se puedan incluir el diseño del muestreo a la 
hora de calcular los errores de las estimaciones.


Un saludo.

El 22/05/16 a las 15:01, Guilherme Amorim Homem de Abreu Loureiro escribió:

Hola a todos:

Necesito saber si alguien tiene alguna idea de un paquete con múltiples
funciones (cálculos) para determinar el tamaño de la muestra
(particularmente de estudios de psicología y ciencias sociales)

De antemano agradezco la atención. Saludo desde Brasil

*Guilherme Amorim Homem de Abreu Loureiro*
Agronomist Engineer
*CREA-BA: 051511013-2*
Master of Science in Crop Production, Soil and Plant Nutrition
*55 27 996215348 / 55 73 991934645*
*Itabuna - Bahia - Brazil*

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Bootstrap de días seguidos

2016-03-31 Por tema Jose Luis Cañadas Reche
Hola.

No sé si buscas algo parecido a esto

datos <- data.frame(v1 = rnorm(1000, 2, 5), v2 = rnorm(1000) )

# numero de puntos aleatorios
n.puntos <- 20
puntos <- replicate(n.puntos, sample(nrow(datos), 1, replace = T) )

puntos
  [1] 348  52 520 675 574 303 264 678 749  29 310 691 460 114 892 903 
335 984 207 964

# muestras de 21 filas
  k <- 20
muestras <- lapply(puntos, function(x) datos[x:(x+k),])

# muestras es una lista con k data.frames, el primero serán los datos de 
la fila 348 hasta la368
muestras[[1]]
 v1  v2
348 -1.8855298  1.67022010
349  8.3539108 -0.75856401
350  3.1723330 -0.15722935
351  2.5871373  1.30962887
352  4.0801806 -0.22205638
353  8.7792425  1.92769400
354  1.8023941  0.60780632
355 -4.4542464 -0.30940621
356  1.4032584 -1.22315174
357 -1.1669957 -0.36789523
358  0.8834993 -0.51625882
359 -4.4173234  0.35013974
360 -6.2964411  0.64394556
361  0.4808418  1.41868648
362  0.6912628 -0.29357748
363 -4.1933794  0.90492395
364 -9.3685116  0.08371681
365  1.3305264 -0.18474498
366  2.9247997  1.24475278
367  8.8120307  0.48149808
368  8.0995250  1.30719019

El 31/03/16 a las 10:46, Jesús Para Fernández escribió:
> Buenas a todos,
>
> Lo primero agradecer todas las respuesta sque tuve en el tema de Bootstrap 
> dataframe, que por estar de baja no he podido agradecer.
>
> De aquel tema sali� una sugerencia que me parece muy interesante y que a dia 
> de hoy no soy capaz de hacer de una manera optima.
>
> Lo que quiero hacer es coger un dia al azar de todo el periodo, y a partuir 
> de ese dia, coger por ejemplo los 20 dias siguientes.
>
> Recuerdo que para cogerlos al azar hacia lo siguiente:
>
> set.seed(121)
> final<-0
> nuevo<-0
> for(i in 1:10){
> nuevo<-sample(datos$pedidos,replace=T)
> final[i]<-sum(nuevo[1:20])
> }
>
> donde aqui estoy cogiendo los 20 dias al azar.
>
> �Como haria para coger estos 20 dias seguidos??
>
> Gracias
> Jes�s
>
>
>
>   
>   [[alternative HTML version deleted]]
>
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Uso excesivo de CPU de RStudio

2016-03-01 Por tema Jose Luis Cañadas Reche

Hola.
Estoy con la misma versión de RStudio y de xubuntu y me pasa como a 
Victoria, un pico al inicio y luego todo bien.


Saludos

El 02/03/16 a las 08:12, Víctor Granda García escribió:

Hola Carlos,
En mi portátil, con archlinux y la misma versión de RStudio no tengo ese
problema, pero recientemente en el trabajo he puesto ubuntu 14.04 (con i3
como windows mánager) y me pasa lo mismo, un pico de uso de CPU al iniciar
RStudio, pero luego va todo bien. Yo lo achaco a Ubuntu (quizás el kernel,
ya que la versión 14.04 de ubuntu sigue con el 3.16 en vez del 4+ que tengo
en archlinux) y no a RStudio.

Un saludo.

El mié., 2 de marzo de 2016 0:26, Carlos Ortega 
escribió:


Hola,

En Mac (10.11.3) con la 0.99.879 no ocurre.
En estado idle, el consumo es de aprox 1Gb RAM y menos del 1% de RAM.
También tengo cuatro núcleos.

Te iba a recomendar que te actualizaras a la versión disponible en la
preview, pero veo que extrañamente la versión es la misma que uso. La
oficial, es más nueva sorprendentemente. Es la primera vez que lo veo así.

Puedes probar a instalarla y ver si el problema continua:
https://www.rstudio.com/products/rstudio/download/preview/

De todas formas, también me ha ocurrido hace poco, que si abortas una
ejecución ("Terminate R") y vuelves a ejecutar una nueva simulación, los
procesos anteriores no cancelan y acabas con muchos procesos "rsession" en
ejecución y consumiendo toda la CPU. Bien, matas estos procesos o sales de
RStudio y vuelves a iniciar sesión.

Finalmente, no veo que haya ningún hilo abierto recientemente en el Soporte
de RStudio sobre esto. Con otros problemas anteriores (usando las preview)
mi experiencia es que aunque normalmente no "pueden reproducir el
problema", acaban en siguientes versiones corrigiendo el problema.

En StackOverflow, hay una entrada reciente, pero no proporciona ninguna
solución:
http://stackoverflow.com/questions/34232990/r-rstudio-cpu-usage-when-idle

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 1 de marzo de 2016, 23:42, Carlos J. Gil Bellosta <
gilbello...@gmail.com>
escribió:


Hola, ¿qué tal?

No sé si alguien ha encontrado (¿y solucionado?) el mismo problema que

yo.

El proceso rstudio (no me refiero a la rsession que levanta), incluso sin
hacer nada con RStudio, sin que corra código, sin gráficos abiertos,

aunque

quede en segundo plano, con el "environment" vacío, consume casi al 100%
una de mis cuatro CPUs.

Sospecho que podrían ser los diagnósticos de código que se han

introducido

en las nuevas versiones, pero no lo he podido confirmar.

Estoy usando la última versión de RStudio (0.99.891) en un Xubuntu 14.04.

Un saludo y muchas gracias,

Carlos J. Gil Bellosta
http://www.datanalytics.com

 [[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es




--
Saludos,
Carlos Ortega
www.qualityexcellence.es

 [[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ¿Por qué no me funciona?

2016-01-27 Por tema Jose Luis Cañadas Reche

Hola.
prueba con ifelse(col>1, 5, 6) en vez de if



El 27/01/16 a las 15:24, david santolaria escribió:

Soy novato, así que imagino que será muy fácil de resolver...

Dataset$total <- with(Dataset, if (col>1) 5 else 6)

Quiero guardar en la columna total, un 5 si col es mayor que 1 y sino que
guarde un 6.

Sólo me compara el primer dato de la primera fila, y lo copia para todas
las demás. No me lo calcula fila a fila.

¿?

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] stargazer

2015-11-25 Por tema Jose Luis Cañadas Reche

Hola.
Pues al pegar tu código desde \begin{table} hasta el final en un 
documento tex  o en un Rnw (dentro de Rstudio y habiendo instalado el 
paquete knitr)  me hace una bonita tabla


Cuéntanos con más detalle el proceso que has seguido.

Saludos

El 25/11/15 a las 19:13, Dr. José A. Betancourt B. escribió:

\begin{table}[!htbp]
  \centering
 \caption{}
\label{}
  \begin{tabular}{@{\extracolsep{5pt}}lc}
  \\[-1.8ex]\hline
  \hline \\[-1.8ex]
  Statistic & \multicolumn{1}{c}{N} & \multicolumn{1}{c}{Mean} &
  \multicolumn{1}{c}{St. Dev.} & \multicolumn{1}{c}{Min} &
\multicolumn{1}{c}{Max} \\ \hline \\[-1.8ex] rating & 30 & 64.633 &
  12.173 & 40 & 85 \\ complaints & 30 & 66.600 & 13.315 & 37 & 90 \\
  privileges & 30 & 53.133 & 12.235 & 30 & 83 \\ learning & 30 & 56.367
  & 11.737 & 34 & 75 \\ raises & 30 & 64.633 & 10.397 & 43 & 88 \\
  critical & 30 & 74.767 & 9.895 & 49 & 92 \\ advance & 30 & 42.933 &
  10.289 & 25 & 72 \\ \hline \\[-1.8ex] \end{tabular} \end{table}




prueba.pdf
Description: Adobe PDF document
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] stargazer

2015-11-16 Por tema Jose Luis Cañadas Reche

Hola
Te crea la tabla en latex,  necesitas instalar texlive en linux o miktex 
en windows.


Saludos

El 16/11/15 a las 17:03, jbetanco...@iscmc.cmw.sld.cu escribió:

Estimados

Cuando quiero hacer una tabla con el paquete stargazer, esto es lo que me
sale, probablemente tengo que instalar algun programa
sessionInfo()
R version 3.2.2 (2015-08-14)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 8 x64 (build 9200)

locale:
[1] LC_COLLATE=Spanish_Spain.1252  LC_CTYPE=Spanish_Spain.1252
[3] LC_MONETARY=Spanish_Spain.1252 LC_NUMERIC=C
[5] LC_TIME=Spanish_Spain.1252

attached base packages:
[1] stats graphics  grDevices utils datasets  methods   base

other attached packages:
[1] stargazer_5.2

loaded via a namespace (and not attached):
[1] tools_3.2.2




stargazer(attitude)

% Table created by stargazer v.5.2 by Marek Hlavac, Harvard University.
E-mail: hlavac at fas.harvard.edu
% Date and time: lu., nov. 16, 2015 - 10:55:58
\begin{table}[!htbp] \centering
   \caption{}
   \label{}
\begin{tabular}{@{\extracolsep{5pt}}lc}
\\[-1.8ex]\hline
\hline \\[-1.8ex]
Statistic & \multicolumn{1}{c}{N} & \multicolumn{1}{c}{Mean} &
\multicolumn{1}{c}{St. Dev.} & \multicolumn{1}{c}{Min} &
\multicolumn{1}{c}{Max} \\
\hline \\[-1.8ex]
rating & 30 & 64.633 & 12.173 & 40 & 85 \\
complaints & 30 & 66.600 & 13.315 & 37 & 90 \\
privileges & 30 & 53.133 & 12.235 & 30 & 83 \\
learning & 30 & 56.367 & 11.737 & 34 & 75 \\
raises & 30 & 64.633 & 10.397 & 43 & 88 \\
critical & 30 & 74.767 & 9.895 & 49 & 92 \\
advance & 30 & 42.933 & 10.289 & 25 & 72 \\
\hline \\[-1.8ex]
\end{tabular}
\end{table}


--
Este mensaje le ha llegado mediante el servicio de correo electronico que 
ofrece Infomed para respaldar el cumplimiento de las misiones del Sistema 
Nacional de Salud. La persona que envia este correo asume el compromiso de usar 
el servicio a tales fines y cumplir con las regulaciones establecidas

Infomed: http://www.sld.cu/

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] potencia fracional de un número negativo

2015-10-15 Por tema Jose Luis Cañadas Reche

Hola.
No sé si va por aquí, pero prueba a quitar el paréntesis a (-0.5)

Ejemplo

> -0.03125^(1/5)
[1] -0.5
>

Y se ve qeu -0.5^(5) es -0.03125

El 15/10/15 a las 06:02, Alex J. Zambrano escribió:

Hola a tod@s.

Realizando el calculo de encontrar la raíz quinta de -0.5, la cual dígito
de la siguiente manera

(-0.5)^(1/5)

El resultado que me arroja R es NaN.

Averiguando un poco entre las ayuda de las funciones aritméticas encuentro
el siguiente comentario

Users are sometimes surprised by the value returned, for example why
(-8)^(1/3) is NaN. For double inputs, R makes use of IEC 60559 arithmetic
on all platforms, together with the C system function pow for the ^
operator. The relevant standards define the result in many corner cases. In
particular, the result in the example above is mandated by the C99
standard. On many Unix-alike systems the command man pow gives details of
the values in a large number of corner cases.

¿Qué opciones puedo utilizar para poder encontrar el resultado?

Agradezco de antemano la colaboración.

Cordial saludo.




___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] consulta graficas para GLM

2015-08-06 Por tema Jose Luis Cañadas Reche
Hola.

Prueba con el en�simo paquete de R , effects, algo asi.

library(effects)

efectos - allEffects(glm6)

plot(efectos)

Saludos

El 06/08/15 a las 09:09, Luis Fernando Garc�a escribi�:
 Estimados amigos y expertos del R,

 Les escribo para hacerles una pregunta que parece un poco sencilla 
 pero me ha costado mucho. Estoy tratando de graficar los datos 
 correspondientes a tasas de consumo de algunos organismos cuando est�n 
 expuestos o no expuestos a un qu�mico sobre tres tipos de presa. Por 
 definici�n, deb�a ajustar los datos a un glm con distribuci�n gama.

 Las gr�ficas pueden ser 1) dos gr�ficos correspondientes a expuesto o 
 no expuesto ( representado con 0 y 1)  y cada uno con tres l�neas 
 (correspondientes a tres presas) o 2) realizar tres gr�ficos 
 (correspondientes a cada tipo de presa), con dos l�neas (expuesto vs 
 no expuesto).  Las l�neas deber�an ser generadas empleando la funci�n 
 predict.

 Para graficar estaba pensando dividir los datos con subset y ajustar 
 un modelo para poder graficar cada l�nea pero no se si sea v�lido.  La 
 otra opci�n es graficar los datos como les mencion� anteriormente a 
 partir del primer modelo, pero no he encontrado nada de informaci�n al 
 respecto. Si alguno pudiera proveerme alguna colaboraci�n o sabe donde 
 puedo encontrar informaci�n sobre como hacer este tipo de gr�fico 
 estar�a muy agradecido.

 Saludos!


 PS: Adjunto el set de datos porque es muy largo



 #Este es el script

 todoslosdatos = read.table(TODOS POLIOSTOMA.txt, header=T)

 Exposici�n1=factor(todoslosdatos$Exposici�n)

 str(todoslosdatos)

 attach(todoslosdatos)

 names(todoslosdatos)

 glm6=glm(Consumo1 ~ I(1/Densidad) +Exposici�n1 + Presa, family = Gamma)

 summary(glm6)

 par(mfrow=c(2,2))

 plot(glm6)

 anova(glm6,test=Chisq)

 summary(glm6)

 library(multcomp)

 compexp - glht(glm6, mcp(Exposici�n1 = Tukey, covariate_average = 
 TRUE))

 summary(compexp)

 plot(Densidad,Consumo1,type=n)










 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] consulta graficas para GLM

2015-08-06 Por tema Jose Luis Cañadas Reche
Supongo que si quieres hacer el gr�fico 1, puedes hacer esto.

efectos - Effect(c(Presa, Exposici�n1), glm6 )

plot(efectos)


El 06/08/15 a las 09:09, Luis Fernando Garc�a escribi�:
 Estimados amigos y expertos del R,

 Les escribo para hacerles una pregunta que parece un poco sencilla 
 pero me ha costado mucho. Estoy tratando de graficar los datos 
 correspondientes a tasas de consumo de algunos organismos cuando est�n 
 expuestos o no expuestos a un qu�mico sobre tres tipos de presa. Por 
 definici�n, deb�a ajustar los datos a un glm con distribuci�n gama.

 Las gr�ficas pueden ser 1) dos gr�ficos correspondientes a expuesto o 
 no expuesto ( representado con 0 y 1)  y cada uno con tres l�neas 
 (correspondientes a tres presas) o 2) realizar tres gr�ficos 
 (correspondientes a cada tipo de presa), con dos l�neas (expuesto vs 
 no expuesto).  Las l�neas deber�an ser generadas empleando la funci�n 
 predict.

 Para graficar estaba pensando dividir los datos con subset y ajustar 
 un modelo para poder graficar cada l�nea pero no se si sea v�lido.  La 
 otra opci�n es graficar los datos como les mencion� anteriormente a 
 partir del primer modelo, pero no he encontrado nada de informaci�n al 
 respecto. Si alguno pudiera proveerme alguna colaboraci�n o sabe donde 
 puedo encontrar informaci�n sobre como hacer este tipo de gr�fico 
 estar�a muy agradecido.

 Saludos!


 PS: Adjunto el set de datos porque es muy largo



 #Este es el script

 todoslosdatos = read.table(TODOS POLIOSTOMA.txt, header=T)

 Exposici�n1=factor(todoslosdatos$Exposici�n)

 str(todoslosdatos)

 attach(todoslosdatos)

 names(todoslosdatos)

 glm6=glm(Consumo1 ~ I(1/Densidad) +Exposici�n1 + Presa, family = Gamma)

 summary(glm6)

 par(mfrow=c(2,2))

 plot(glm6)

 anova(glm6,test=Chisq)

 summary(glm6)

 library(multcomp)

 compexp - glht(glm6, mcp(Exposici�n1 = Tukey, covariate_average = 
 TRUE))

 summary(compexp)

 plot(Densidad,Consumo1,type=n)










 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] glm com etiquetas en las variables

2015-07-21 Por tema Jose Luis Cañadas Reche

Hola.

Otra idea es utilizar el paquete memisc

library(MASS)
data(birthwt, package=MASS)
birthwt$low  - factor(birthwt$low)
birthwt$race - factor(birthwt$smoke)
REG_LOG - glm (low ~ smoke, family = binomial, data = birthwt)
summary (REG_LOG)

library(memisc)

mtable1 - mtable(REG_LOG)

mtable1 - relabel(mtable1,
  (Intercept) = Constante,
  smoke = Consumo tabaco embarazo
)
mtable1

Calls:
REG_LOG: glm(formula = low ~ smoke, family = binomial, data = birthwt)

==
Constante-1.087***
 (0.215)
Consumo tabaco embarazo   0.704*
 (0.320)
--
Aldrich-Nelson R-sq.0.025
McFadden R-sq.  0.021
Cox-Snell R-sq. 0.025
Nagelkerke R-sq.0.036
phi 1.000
Likelihood-ratio4.867
p   0.027
Log-likelihood   -114.902
Deviance  229.805
AIC   233.805
BIC   240.288
N 189
==

# o un fichero separado por comas
write.mtable(mtable1, file = resumen.csv, colsep=,)



El 21/07/15 a las 11:26, Carlos Ortega escribió:

Hola,

Esta es una alternativa sólo válida para el modelo de ejemplo, pero te da
una idea de cómo se podría hacer...

Se puede generalizar para que tengas un vector con las relaciones nombres
de las variables y su descripción y al hacer la asignación (mySummary$call)
las cambie programáticamente.

#---

mySummary - summary (REG_LOG)
mySummary$call - c(glm(formula = low = 'Bajo peso...' ~ smoke = 'Consumo
tabaco..', family = 'binomial', data = birthwt))
mySummary
#---


Saludos,
Carlos Ortega
www.qualityexcellence.es

El 21 de julio de 2015, 10:57, Griera gri...@yandex.com escribió:


Hola:

Si aún hay alguien que no está de vacaciones, igual me pueden ayudar.

Quiero ajustar unos modelos:

 REG_LOG - glm (low ~ X, family = binomial, data = DATOS)

Ejemplo:
   library(MASS)
   data(birthwt, package=MASS)
   birthwt$low  - factor(birthwt$low)
   birthwt$race - factor(birthwt$smoke)
   REG_LOG - glm (low ~ smoke, family = binomial, data = birthwt)
   summary (REG_LOG)

Se pueden colocar etiquetas en las variable de la fórmula de manera que en
los resultados salgan las etiquetas y no el nombre de la variable? Seria
una cosa como:

REG_LOG - glm (low = Bajo peso recién nacido ~ smoke = Consumo tabaco
embarazo, family = binomial, data = birthwt)

que, evidentemente no funciona.

Muchas gracias y saludos

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es






___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Homenaje a Gregorio Serrano

2015-06-02 Por tema Jose Luis Cañadas Reche

Que pena no poder asistir.
Un abrazo a todos.



El 02/06/15 a las 10:48, Pedro Concejero Cerezo escribió:
 Hola, nos ha llegado noticia de un homenaje a Gregorio Serrano el pr�ximo 19 
 de junio, a las 12 mediod�a, en la Facultad de Econ�micas de la UCM, donde 
 era profesor y donde tuvimos la primera reuni�n del gRupo R de madRid. 
 Detalles m�s abajo.
 Nos dicen que es un acto abierto a todos los que conocimos a Gregorio.
 El acto ser� en la Sala del Instituto Complutense de An�lisis Econ�mico 
 (ICAE), edificio de primer curso de la Facultad de Econ�micas, Universidad 
 Complutense de Madrid, en el campus de Somosaguas.
 Tiene buena conexi�n con transporte p�blico, autobuses y metro ligero. 
 Detalles:
 http://economicasyempresariales.ucm.es/contacto_economicasyempresariales

 Saludos,
 Pedro
 --
 Pedro Concejero
 BI  Big Data - Internal Exploitation - Telef�nica I+Dhttp://www.tid.es
 E-mail: 
 pedro.concejerocer...@telefonica.commailto:pedro.concejerocer...@telefonica.com
 skype: pedro.concejero
 twitter @ConcejeroPedrohttps://twitter.com/ConcejeroPedro
 linkedin pedroconcejerohttp://www.linkedin.com/in/pedroconcejero/es
 Entusiasta R, me encontrar�is aqu� gRupo R madRid http://madrid.r-es.org/

 

 Este mensaje y sus adjuntos se dirigen exclusivamente a su destinatario, 
 puede contener informaci�n privilegiada o confidencial y es para uso 
 exclusivo de la persona o entidad de destino. Si no es usted. el destinatario 
 indicado, queda notificado de que la lectura, utilizaci�n, divulgaci�n y/o 
 copia sin autorizaci�n puede estar prohibida en virtud de la legislaci�n 
 vigente. Si ha recibido este mensaje por error, le rogamos que nos lo 
 comunique inmediatamente por esta misma v�a y proceda a su destrucci�n.

 The information contained in this transmission is privileged and confidential 
 information intended only for the use of the individual or entity named 
 above. If the reader of this message is not the intended recipient, you are 
 hereby notified that any dissemination, distribution or copying of this 
 communication is strictly prohibited. If you have received this transmission 
 in error, do not read it. Please immediately reply to the sender that you 
 have received this communication in error and then delete it.

 Esta mensagem e seus anexos se dirigem exclusivamente ao seu destinat�rio, 
 pode conter informa��o privilegiada ou confidencial e � para uso exclusivo da 
 pessoa ou entidade de destino. Se n�o � vossa senhoria o destinat�rio 
 indicado, fica notificado de que a leitura, utiliza��o, divulga��o e/ou c�pia 
 sem autoriza��o pode estar proibida em virtude da legisla��o vigente. Se 
 recebeu esta mensagem por erro, rogamos-lhe que nos o comunique imediatamente 
 por esta mesma via e proceda a sua destrui��o

   [[alternative HTML version deleted]]



 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] cantidad de datos

2015-04-29 Por tema Jose Luis Cañadas Reche

Hola.
Yo en vez de utilizar análisis cluster que impliquen distancias, 
probaría con un kmedias o con un pam (partition around medoids) pero 
utilizando muestras, la función clara de la librería cluster puede 
ayudarte. Pego el details de la ayuda de 'clara'


Details

clara is fully described in chapter 3 of Kaufman and Rousseeuw (1990). 
Compared to other partitioning methods such as pam, it can deal with 
much larger datasets. Internally, this is achieved by considering 
sub-datasets of fixed size (sampsize) such that the time and storage 
requirements become linear in n rather than quadratic.


Each sub-dataset is partitioned into k clusters using the same algorithm 
as in pam.
Once k representative objects have been selected from the sub-dataset, 
each observation of the entire dataset is assigned to the nearest medoid.


The mean (equivalent to the sum) of the dissimilarities of the 
observations to their closest medoid is used as a measure of the quality 
of the clustering. The sub-dataset for which the mean (or sum) is 
minimal, is retained. A further analysis is carried out on the final 
partition.


Each sub-dataset is forced to contain the medoids obtained from the best 
sub-dataset until then. Randomly drawn observations are added to this 
set until sampsize has been reached.


Saludos

El 29/04/15 a las 19:06, Carlos J. Gil Bellosta escribió:

Hola, ¿qué tal?

291GB viene a ser

280 * 280 * 1e6 * 8 / 2^30 / 2

que es el número de GB necesarios para almacenar la matriz de
distancias entre 280k sujetos.

Hay que buscar una alternativa que no implique precalcular esa enormidad.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com





El día 29 de abril de 2015, 18:20,  javier.ruben.marcu...@gmail.com escribió:

Estimados

Creo que se puede presentar un problema con el sistema operativo, al ser de
32 bit si no recuerdo mal soporta hasta 4 GB, aunque no estoy del todo
seguro.

Los 292 GB que informa Carlos son una enormidad, esos requerimientos son
complicados.

¿Qué posibilidad hay de trabajar con memoria virtual en windows? Aunque me
parece que no sería optimo, prefiero intentar en Linux y R.

Su sistema es de 32 bit, pero ¿la computadora?, ¿ambos son 32?, ¿el i5 no es
de 64 bit?. Posiblemente tenga la opción de usar un sistema operativo de 64
bit, como también de poder comprar más memoria (siempre en 64 bit), aunque
me asustan los 292 GB que informa Carlos.

Javier Marcuzzi

De: Carlos Ortega
Enviado el: ‎miércoles‎, ‎29‎ de ‎abril‎ de ‎2015 ‎12‎:‎49‎ ‎p.m.
Para: Alva Valiente, Ricardo (RIAV)
CC: R-help-es@r-project.org

No sé si va a ser suficiente
Acabo de correr un ejemplo equivalente:

# Example
mydat - matrix(rnorm(28*20), ncol=20)
hc - hclust(dist(mydat), ave)
plot(hc)
plot(hc, hang = -1)

sobre Azure Machine Learning y ...



Saludos,
Carlos Ortega
www.qualityexcellence.es

El 29 de abril de 2015, 17:45, Alva Valiente, Ricardo (RIAV)
r...@cajatrujillo.com.pe escribió:

Bueno mi máquina es:

HP

Windows 7

Procesador Core I5 de 2.5 GHz

4 GB de Ram (2.94 GB utilizables)

Sistema operativo de 32 bits

Versión de R, 3.2.0





Atte.

Ricardo Alva Valiente

Analista de Control Preventivo

Unidad de Prevención

Of. Recuperaciones – CC Boulevard Chiclayo

'(074) 232740

RPC 978194441 RPM *157793

*r...@cajatrujillo.com.pe

www.cajatrujillo.com.pe





De: Carlos Ortega [mailto:c...@qualityexcellence.es]
Enviado el: miércoles, 29 de abril de 2015 10:39 AM
Para: Alva Valiente, Ricardo (RIAV)
CC: r-help-es@r-project.org
Asunto: Re: [R-es] cantidad de datos



Hola,

La matriz que vas a procesar será de alrededor de 45 Mb. No creo que
tengas problemas para cargar este conjunto de datos a tu entorno.

El problema puede aparecer en generar el objeto clúster y esto dependerá
de la RAM que tengas disponible.

Pásanos el detalle de la máquina que utilizarías y la versión de R que
usas.


He simulado tu conjunto y he tenido problemas a la hora de generar el
clúster. Mi máquina es un MacBook, de 8Gb.



Saludos,

Carlos Ortega.



El 29 de abril de 2015, 16:25, Alva Valiente, Ricardo (RIAV)
r...@cajatrujillo.com.pe escribió:

Estimados dos consultas.
-Debo de trabajar con 280,000.00 casos y 20 variables. Quisiera saber si
el programa soporta sin ningún inconveniente análisis cluster y
discriminantes, así como análisis uni variados y bi variados.
-Cuando se grafica un dendograma como puedo hacer para que todas las
líneas de los casos, partan desde el X, porque cuando se genera se visualiza
bien desordenado (unas líneas comienzan mas arriba que otras). También como
hacer para que los nombres de los casos aparezcan en vertical y no en
horizontal; y si es posible el gráfico también.

Muchas gracias de antemano.

Atte.
Ricardo Alva Valiente

Aviso Legal: La información de este correo electrónico, así como de sus
archivos adjuntos, es confidencial y está dirigida exclusivamente a él o los
destinatarios. Si Usted ha recibido este correo por error, por favor
avísenos inmediatamente por este 

Re: [R-es] cantidad de datos

2015-04-29 Por tema Jose Luis Cañadas Reche
Podrías hacer varios kmedias con diferente número de clusters y 
comprobar como varía la suma de cuadrados entre cluster para elegir el 
número óptimo.

# Determine number of clusters
wss - (nrow(mydata)-1)*sum(apply(mydata,2,var))
for (i in 2:15) wss[i] - sum(kmeans(mydata,
centers=i)$withinss)
plot(1:15, wss, type=b, xlab=Number of Clusters,
   ylab=Within groups sum of squares)

El 29/04/15 a las 19:42, Alva Valiente, Ricardo (RIAV) escribió:
 El inconveniente con un K-medias, es que se tiene que se tiene que pre 
 definir el número de segmentos, pero eso es algo con lo q no cuento. La 
 solución de Javier me parece q sería la única opción.

 Atte.
 Ricardo Alva Valiente

 -Mensaje original-
 De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de 
 javier.ruben.marcu...@gmail.com
 Enviado el: miércoles, 29 de abril de 2015 12:16 PM
 Para: jose luis cañadas; R-help-es@r-project.org
 Asunto: Re: [R-es] cantidad de datos

 Estimados


 Justo se me ocurrió una búsqueda y el resultado es parecido.

 http://www.r-bloggers.com/k-means-clustering-on-big-data/

 Javier Marcuzzi

 De: jose luis cañadas
 Enviado el: ‎miércoles‎, ‎29‎ de ‎abril‎ de ‎2015 ‎02‎:‎10‎ ‎p.m.
 Para: R-help-es@r-project.org


 Hola.
 Yo en vez de utilizar análisis cluster que impliquen distancias, probaría con 
 un kmedias o con un pam (partition around medoids) pero utilizando muestras, 
 la función clara de la librería cluster puede ayudarte. Pego el details de la 
 ayuda de 'clara'

 Details

 clara is fully described in chapter 3 of Kaufman and Rousseeuw (1990).
 Compared to other partitioning methods such as pam, it can deal with much 
 larger datasets. Internally, this is achieved by considering sub-datasets of 
 fixed size (sampsize) such that the time and storage requirements become 
 linear in n rather than quadratic.

 Each sub-dataset is partitioned into k clusters using the same algorithm as 
 in pam.
 Once k representative objects have been selected from the sub-dataset, each 
 observation of the entire dataset is assigned to the nearest medoid.

 The mean (equivalent to the sum) of the dissimilarities of the observations 
 to their closest medoid is used as a measure of the quality of the 
 clustering. The sub-dataset for which the mean (or sum) is minimal, is 
 retained. A further analysis is carried out on the final partition.

 Each sub-dataset is forced to contain the medoids obtained from the best 
 sub-dataset until then. Randomly drawn observations are added to this set 
 until sampsize has been reached.

 Saludos

 El 29/04/15 a las 19:06, Carlos J. Gil Bellosta escribió:
 Hola, ¿qué tal?

 291GB viene a ser

 280 * 280 * 1e6 * 8 / 2^30 / 2

 que es el número de GB necesarios para almacenar la matriz de
 distancias entre 280k sujetos.

 Hay que buscar una alternativa que no implique precalcular esa enormidad.

 Un saludo,

 Carlos J. Gil Bellosta
 http://www.datanalytics.com





 El día 29 de abril de 2015, 18:20,  javier.ruben.marcu...@gmail.com 
 escribió:
 Estimados

 Creo que se puede presentar un problema con el sistema operativo, al
 ser de
 32 bit si no recuerdo mal soporta hasta 4 GB, aunque no estoy del
 todo seguro.

 Los 292 GB que informa Carlos son una enormidad, esos requerimientos
 son complicados.

 ¿Qué posibilidad hay de trabajar con memoria virtual en windows?
 Aunque me parece que no sería optimo, prefiero intentar en Linux y R.

 Su sistema es de 32 bit, pero ¿la computadora?, ¿ambos son 32?, ¿el
 i5 no es de 64 bit?. Posiblemente tenga la opción de usar un sistema
 operativo de 64 bit, como también de poder comprar más memoria
 (siempre en 64 bit), aunque me asustan los 292 GB que informa Carlos.

 Javier Marcuzzi

 De: Carlos Ortega
 Enviado el: ‎miércoles‎, ‎29‎ de ‎abril‎ de ‎2015 ‎12‎:‎49‎ ‎p.m.
 Para: Alva Valiente, Ricardo (RIAV)
 CC: R-help-es@r-project.org

 No sé si va a ser suficiente
 Acabo de correr un ejemplo equivalente:

 # Example
 mydat - matrix(rnorm(28*20), ncol=20) hc - hclust(dist(mydat),
 ave)
 plot(hc)
 plot(hc, hang = -1)

 sobre Azure Machine Learning y ...



 Saludos,
 Carlos Ortega
 www.qualityexcellence.es

 El 29 de abril de 2015, 17:45, Alva Valiente, Ricardo (RIAV)
 r...@cajatrujillo.com.pe escribió:
 Bueno mi máquina es:

 HP

 Windows 7

 Procesador Core I5 de 2.5 GHz

 4 GB de Ram (2.94 GB utilizables)

 Sistema operativo de 32 bits

 Versión de R, 3.2.0





 Atte.

 Ricardo Alva Valiente

 Analista de Control Preventivo

 Unidad de Prevención

 Of. Recuperaciones – CC Boulevard Chiclayo

 '(074) 232740

 RPC 978194441 RPM *157793

 *r...@cajatrujillo.com.pe

 www.cajatrujillo.com.pe





 De: Carlos Ortega [mailto:c...@qualityexcellence.es] Enviado el:
 miércoles, 29 de abril de 2015 10:39 AM
 Para: Alva Valiente, Ricardo (RIAV)
 CC: r-help-es@r-project.org
 Asunto: Re: [R-es] cantidad de datos



 Hola,

 La matriz que vas a procesar será de alrededor de 45 Mb. No creo que
 tengas problemas para cargar este conjunto de datos a 

Re: [R-es] paquete DBmethods

2015-04-27 Por tema Jose Luis Cañadas Reche

Hola.
La función vegdist del paquete vegan implementa varias distancias, entre 
ellas dos versiones de la distancia de Gower, por si es de utilidad.


Saludos

El 27/04/15 a las 19:29, Freddy Omar López Quintero escribió:

ya lo encontré en la misma página de R, sino que esta en otro paquete de
los mismo autores bajo el nombre de ICGE, allí se encuentra la distancia de
gower.


Por si otros usuarios necesitan la función...​



___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] htmlreg en documento markdown

2015-03-12 Por tema Jose Luis Cañadas Reche

Hola de nuevo.

He dado con la solución y la comparto. El tema es que hay que compilar 
el documento usando knit2html(fichero.Rmd) desde consola en vez de 
usar el botón KnitHTML que aparece en RStudio.


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] htmlreg en documento markdown

2015-03-12 Por tema Jose Luis Cañadas Reche

Hola.

En un documento rmarkdown quiero utilizar el paquete texreg y más 
concretamente la función htmlreg para mostrar los resultados de unos 
modelos en una tabla htlm, pero no doy con la forma de que salga bien. 
¿Alguna idea?



Parte de mi código


```{r, echo=FALSE, results='hide'}
library(texreg)


```

```{r, echo=FALSE}
htmlreg(list(fw.4,fn.4), doctype = F, html.tag = F, inline.css = T,
head.tag = F, body.tag = F, center = F, single.row = T, caption = )

```

He probado poniendo results = 'asis' en la opción del chunk y también 
con las opciones por defecto de htmlreg, pero ninguna funciona.


Gracias

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Instalando R en Linux Debian

2014-11-13 Por tema Jose Luis Cañadas Reche
Hola.
Mira en cran.r-project.org  en la parte de como instalar R en linux, 
básicamente necesitas añadir una línea al sources.list

debhttp://favorite-cran-mirror/bin/linux/debian  
http://%3Cfavorite-cran-mirror%3E/bin/linux/debian  squeeze-cran3/

por ejemplo pon en el sources.list

debhttp://cran.rstudio.com/bin/linux/debian  
http://%3Cfavorite-cran-mirror%3E/bin/linux/debian  squeeze-cran3/

y tb ejecuta en consola, puede que como root

apt-key adv --keyserver keys.gnupg.net --recv-key 381BA480

Y luego ya puedes instalarlo con apt-get

Saludos


El 13/11/14 a las 16:02, Jesus Herranz escribió:
 Hola

 Estoy instalando R en una m�quina con Linux Debian. Lo hago con la orden
 �apt-get install r-base r-base-dev� y me instala la versi�n 2.15.1 mientras
 que yo necesito algunos paquetes que solo funcionan con 3.0 en adelante (por
 ejemplo, Rccp).

 Gracias

   

   

   


   [[alternative HTML version deleted]]



 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] predict en objetos creados por kknn

2014-10-28 Por tema Jose Luis Cañadas Reche

Hola Raúl.

No he visto tu código en profundidad, pero puede ser que en el último 
gráfico estás llamando a g, que es ggplot creado para los datos de 
entrenamiento y le pintes la predicción de los datos de test. Deberías 
pintar los datos de test y su predicción. Quizá esto te valga.


g2 - ggplot(test,aes(test$x,test$y)) +
geom_point()

g2 + geom_point(aes(colour = predict(knn.Cuadrado,test.Cuadrado)))+
ggtitle(Un poco menos mojón )


El 28/10/14 a las 18:06, Raúl Vaquerizo escribió:

#Datos
#Se trata de una nube de puntos en el plano
long = 1
x - runif(long,1,100)
y - runif(long,1,100)
datos - data.frame(x,y)

#Creamos un conjunto de datos de entrenamiento y otro de test
indices - sample(1:long,long/2)
entrenamiento - datos[indices,]
test - datos[-indices,]


#Preparamos un gráfico de dispersión
library(ggplot2)
g - ggplot(entrenamiento,aes(entrenamiento$x,entrenamiento$y)) +
geom_point()

#g

#Vamos a crear las clases que nos un cuadrado
C - ifelse(entrenamiento$x20  entrenamiento$x80  entrenamiento$y20
entrenamiento$y80,1,0)

#Pintamos en nuestra nube de puntos ese cuadrado
g + geom_point(aes(colour = C))+ opts(title=PINTAMOS UN CUADRADO)

#Comenzamos a trabajar con knn
#La librería será kknn
library(kknn)

#Voy a buscar el mejor modelo k maximo 10 y unas funciones kernel
entreno.Cuadrado-cbind(C,entrenamiento)
aprox.Cuadrado - train.kknn(C ~ x + y, data = entreno.Cuadrado,
kmax = 10, kernel = c(rectangular, triangular, epanechnikov,
gaussian, rank))
plot(aprox.Cuadrado)

#Triangular con k=4 es el que mejor pinta tiene si pintáis los
fitted.values queda de lujo
test.Cuadrado-cbind(C,test)
knn.Cuadrado -
kknn(C~x+y,entreno.Cuadrado,test.Cuadrado,k=4,kernel=triangular)

g + geom_point(aes(colour = predict(knn.Cuadrado,test.Cuadrado)))+
opts(title=PINTAMOS UN MOJÓN)


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Heatmap de paro (o de otra cosa) en España

2014-10-16 Por tema Jose Luis Cañadas Reche

Hola Pedro.

El INE cambió los ficheros de microdatos no hace mucho, aquí dejo como 
se haría ahora, (utilizando MicroDatosEs). Lo que cambia es la función 
para recodificar.


http://rpubs.com/joscani/unemplrate


El 15/10/14 a las #4, Carlos Ortega escribió:

Hola Pedro,

Acabo de recordar que hace poco José Luis Cañadas (participa en esta lista)
publicó un enlace suyo a un análisis del paro en Analucía hecho con R y
publicado en RPubs. Sobre mapas asocia diferentes nivels de paro con
diferentes matices de color (rojo)...

Este es el enlace:

http://rpubs.com/joscani/12805

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 14 de octubre de 2014, 18:48, Pedro Concejero Cerezo 
pedro.concejerocer...@telefonica.com escribió:


Hola eRReRos, estamos preparando un talleR de coloR para el próximo
congreso y pensamos que el mejor ejemplo sería un mapa de España de
alguna variable interesante. Puesto que algunas de las cosas candentes
que preocupan en España son (afortunadamente) casos únicos, se nos
ocurre el gran problema del paro. Atención pregunta:
¿Hay algún script maravilloso publicado por ahí que nos permita
reproducir rápido un heatmap de paro sobre el mapa España? -o podría ser
de otra cosa interesante. Sobre él aplicaremos las recomendaciones de
color.
Gracias mil!!

--
*Pedro Concejero
BI  Big Data - Internal Exploitation - Telefónica I+D http://www.tid.es
E-mail: pedro.concejerocer...@telefonica.com
skype: pedro.concejero
twitter @ConcejeroPedro https://twitter.com/ConcejeroPedro
linkedin pedroconcejero http://www.linkedin.com/in/pedroconcejero/es
Únete a la lista R en español
https://stat.ethz.ch/mailman/listinfo/r-help-es#%21 y a tu gRupo local
R, el mío es el gRupo R madRid http://http://madrid.r-es.org/ *



Este mensaje y sus adjuntos se dirigen exclusivamente a su destinatario,
puede contener información privilegiada o confidencial y es para uso
exclusivo de la persona o entidad de destino. Si no es usted. el
destinatario indicado, queda notificado de que la lectura, utilización,
divulgación y/o copia sin autorización puede estar prohibida en virtud de
la legislación vigente. Si ha recibido este mensaje por error, le rogamos
que nos lo comunique inmediatamente por esta misma vía y proceda a su
destrucción.

The information contained in this transmission is privileged and
confidential information intended only for the use of the individual or
entity named above. If the reader of this message is not the intended
recipient, you are hereby notified that any dissemination, distribution or
copying of this communication is strictly prohibited. If you have received
this transmission in error, do not read it. Please immediately reply to the
sender that you have received this communication in error and then delete
it.

Esta mensagem e seus anexos se dirigem exclusivamente ao seu destinatário,
pode conter informação privilegiada ou confidencial e é para uso exclusivo
da pessoa ou entidade de destino. Se não é vossa senhoria o destinatário
indicado, fica notificado de que a leitura, utilização, divulgação e/ou
cópia sem autorização pode estar proibida em virtude da legislação vigente.
Se recebeu esta mensagem por erro, rogamos-lhe que nos o comunique
imediatamente por esta mesma via e proceda a sua destruição

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es






___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Calcular Conductance, cut ratio, Expansion

2014-07-24 Por tema Jose Luis Cañadas Reche
Hola.

Quizá te pueda servir la charla que dieron en el GIL (Grupo de Interés 
Local) de Madrid que se impartió el jueves 4 de Abril de 2013. Mira aquí
http://r-es.org/tiki-index.php?page=Grupo%20de%20Inter%C3%A9s%20Local%20de%20Madrid%20-%20GIL%20Madrid

  y busca en la página *Análisis de Redes Sociales con R*

Saludos.

PD: Y ya de paso podrías darte de alta en la comunidad de usuarios de 
R-hispano ;)
El 24/07/14 a las #4, Amalia Carolina Guaymas Canavire escribió:
 Saludo!, ante todo gracias por su ayuda. Estoy trabajando con grafos y
 quería validar las comunidades encontradas con los diferentes algoritmos
 presentes en igraph.
 A la hora de validar las comunidades considero la modularidad, pero también
 me gustaría ver Conductancia, Radio de corte, Expansión, pero no se si ya
 están implementados en algunas otras librerías, alguien sabe?, pues busqué
 y no hay sugerencias.
 Por otro lado tenía pensado calcularlas pero alguien sabe como se puede
 contar los edges de un grafo en base a unos determinados nodos
 indicados?.POR FAVOR SE RECIBE SUGERENCIAS.

   [[alternative HTML version deleted]]



 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] [Grupo de Usuarios R Madrid]: Siguiente reunión el 1-julio... (Agenda disponible)...

2014-07-17 Por tema Jose Luis Cañadas Reche
Me pilla un poco lejos de dónde trabajo. ;) Estaría interesado en que 
fuera en Córdoba o Granada. Sé que en Granada hay unos cuantos eRReros 
entre la uni y alguna que otra empresa, y en Málaga también hay unos 
cuantos..


Saludos
El 17/07/14 23:03, Rubén Gómez Antolí escribió:

Hola:

El 02/07/14 a las #4, Jose Luis Cañadas Reche escribió:

[...]
Ya de paso pregunto si alguien está interesado en
hacer  un GIL (Grupo de Interés Local) en Andalucía..

¿En que zona tienes interés?

En Almería no hay muchos eRReros pero alguno que otro estamos.

Salud y Revolución.

Lobo.


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] bucle

2014-07-10 Por tema Jose Luis Cañadas Reche
Hola.

La alternativa de Isidro es la que yo uso normalmente en este tipo de 
cosas. Si algún caso que no cumpla ninguna de las condiciones te quedará 
con cinr=NA.

Saludos

El 10/07/14 17:10, juan(uned) escribió:
 Eva muchas gracias por la contestación pero hay muchos casos que no
 cumplen la condición y cinr toma el valor NA porque inr toma valores
 fuera de los intervalos que pongo pero rango_inr1 siempre toma uno de
 los 11 valores, además sum(table(rango_inr1)) es 3738. Podías concretar
 la opción que comentas de ifelse().
 Muchas gracias a Jorge y a Isidro. Probaré la alternativa de Isidro.

 Un cordial saludo,

 Juan

 El 10/07/2014 9:37, Eva Prieto Castro escribió:
 Hola, Juan:

 Eso sólo es posible si exactamente para uno de los valores de i no se
 cumple ninguna de las condiciones, con lo cual no llegas a incorporar
 valor en cinr.

 Puedes utilizar if else de modo que te emita un mensaje informando del
 i que no supera ninguno de los if.

 Un saludo.
 Eva


 El Jueves 10 de julio de 2014 8:58, juan(uned) j...@edu.uned.es
 escribió:


 Estimados compañeros, hoy me ha surgido una duda, quizás trivial, pero
 que no encuentro sentido. Tengo un bucle con el siguiente código:

 for (i in 1:n)
 {
 if (rango_inr1[i]==1  (inr[i]= 2  inr[i]= 3)) cinr[i]-1
 if (rango_inr1[i]==2  (inr[i]= 2.5  inr[i]= 3.5)) cinr[i]-2
 if (rango_inr1[i]==3  (inr[i]= 2  inr[i]= 2.9)) cinr[i]-3
 if (rango_inr1[i]==4  (inr[i]= 2.25  inr[i]= 3.5)) cinr[i]-4
 if (rango_inr1[i]==5  (inr[i]= 2.2  inr[i]= 3.25)) cinr[i]-5
 if (rango_inr1[i]==6  (inr[i]= 2  inr[i]= 3.5)) cinr[i]-6
 if (rango_inr1[i]==7  (inr[i]= 2  inr[i]= 4)) cinr[i]-7
 if (rango_inr1[i]==8  (inr[i]= 2  inr[i]= 2.6)) cinr[i]-8
 if (rango_inr1[i]==9  (inr[i]= 2  inr[i]= 2.5)) cinr[i]-9
 if (rango_inr1[i]==10  (inr[i]= 2  inr[i]=2.8)) cinr[i]-10
 if (rango_inr1[i]==11  (inr[i]= 2.5  inr[i]= 4)) cinr[i]-11
 }

 donde n vale 3738 e i naturalmente 3738. Pues bien, resulta que la
 variable creada cinr tiene 3737 casos. ¿Qué puede estar ocurriendo?. He
 comprobado los casos de rango_inr1 y de inr y son 3738.
 ¿Qué estoy haciendo mal?.

 Un cordial saludo,

 Juan

 -- 
 Juan Antonio Gil Pascual
 Profesor de Metodología de la Investigación Cuantitativa
 correo: j...@edu.uned.es mailto:j...@edu.uned.es
 web: www.uned.es/personal/jgil

 Dpto. MIDE
 Facultad de Educación
 c/Juan del Rosal, 14 desp. 2.72
 28040 Madrid
 Tel,f. 91 3987279
 Fax. 91 3987288

 ___
 R-help-es mailing list
 R-help-es@r-project.org mailto:R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es



 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es