Re: [R-es] Gráfico al estilo heatmap, pero no heatmap XD

2021-01-07 Por tema Eric
Muchas gracias Carlos, un abrazo,

Eric.




On 07-01-21 18:48, Carlos Ortega wrote:
> Y tienes más alternativas aquí:
>
> https://www.r-graph-gallery.com/2d-density-plot-with-ggplot2.html 
> 
>
> El jue, 7 ene 2021 a las 22:47, Carlos Ortega 
> (mailto:c...@qualityexcellence.es>>) escribió:
>
> Hola,
>
> Mira esto:
>
> https://github.com/LKremer/ggpointdensity
> 
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es 
>
> El jue, 7 ene 2021 a las 22:29, Eric ( >) escribió:
>
> Que tal comunidad, tengo un problema al que le he dado vueltas
> para
> resolverlo con R y creo que he llegado a una solución, pero
> pienso que
> ya le debe haber pasado a alguien y que ya debe estar
> implementado en R.
> SIn embargo, me ha ido mal en mi búsqueda porque, a pesar de
> la simpleza
> del problema, al parecer tengo dificultades para describirlo
> correctamente así es que no doy con su solución en la web. Por
> eso vengo
> a preguntarle a inteligencias humanas, a ver si me entienden
> mejor que
> las IA de los buscadores XD. El problema es el siguiente:
>
> Tengo una matriz con varios miles de filas y dos columnas.
> Esas dos
> columnas las represento en un scatterplot que por tener muchos
> puntos
> juntos uno al lado, e incluso sobre el otro, se observa como
> una masa
> oscura sin una tendencia clara. Sin embargo, tengo un R2 de
> más de 0.5,
> así es que tan masa oscura no es, hay alguna tendencia en la
> relación de
> las variables, pero no se aprecia gráficamente. De modo que
> quisiera
> colorear el gráfico 2D de manera que aquellas zonas con más
> densidad de
> puntos sean más rojas y las con menos puntos sean más
> amarillas, por
> ejemplo. Pensé crear una tercera columna manualmente para
> aquellos casos
> en que haya un punto exactamente sobre otro, pero tengo el
> problema de
> que las variables son contínuas, de modo que un punto con
> exactamente
> las mismas coordenadas XY es raro, aunque están uno al ladito
> del otro.
>
> Así es que mi pregunta es si hay alguna librería en R que me
> resuelva el
> problema de colorear automáticamente el scatterplot de acuerdo
> a la
> densidad de puntos de un sector al estilo heatmap (heatmap no
> me sirve
> porque requiere que yo indique la tercera componente del
> gráfico XYZ
> para colorearlo).
>
> Como siempre muchas gracias por su atención y tiempo. Espero
> dar la mano
> de vuelta cuando me sea posible.
>
> Saludos !!
>
> Eric.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org 
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> 
>
>
>
> -- 
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es 
>
>
>
> -- 
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es 

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Gráfico al estilo heatmap, pero no heatmap XD

2021-01-07 Por tema Carlos Ortega
Y tienes más alternativas aquí:

https://www.r-graph-gallery.com/2d-density-plot-with-ggplot2.html

El jue, 7 ene 2021 a las 22:47, Carlos Ortega ()
escribió:

> Hola,
>
> Mira esto:
>
> https://github.com/LKremer/ggpointdensity
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El jue, 7 ene 2021 a las 22:29, Eric ()
> escribió:
>
>> Que tal comunidad, tengo un problema al que le he dado vueltas para
>> resolverlo con R y creo que he llegado a una solución, pero pienso que
>> ya le debe haber pasado a alguien y que ya debe estar implementado en R.
>> SIn embargo, me ha ido mal en mi búsqueda porque, a pesar de la simpleza
>> del problema, al parecer tengo dificultades para describirlo
>> correctamente así es que no doy con su solución en la web. Por eso vengo
>> a preguntarle a inteligencias humanas, a ver si me entienden mejor que
>> las IA de los buscadores XD. El problema es el siguiente:
>>
>> Tengo una matriz con varios miles de filas y dos columnas. Esas dos
>> columnas las represento en un scatterplot que por tener muchos puntos
>> juntos uno al lado, e incluso sobre el otro, se observa como una masa
>> oscura sin una tendencia clara. Sin embargo, tengo un R2 de más de 0.5,
>> así es que tan masa oscura no es, hay alguna tendencia en la relación de
>> las variables, pero no se aprecia gráficamente. De modo que quisiera
>> colorear el gráfico 2D de manera que aquellas zonas con más densidad de
>> puntos sean más rojas y las con menos puntos sean más amarillas, por
>> ejemplo. Pensé crear una tercera columna manualmente para aquellos casos
>> en que haya un punto exactamente sobre otro, pero tengo el problema de
>> que las variables son contínuas, de modo que un punto con exactamente
>> las mismas coordenadas XY es raro, aunque están uno al ladito del otro.
>>
>> Así es que mi pregunta es si hay alguna librería en R que me resuelva el
>> problema de colorear automáticamente el scatterplot de acuerdo a la
>> densidad de puntos de un sector al estilo heatmap (heatmap no me sirve
>> porque requiere que yo indique la tercera componente del gráfico XYZ
>> para colorearlo).
>>
>> Como siempre muchas gracias por su atención y tiempo. Espero dar la mano
>> de vuelta cuando me sea posible.
>>
>> Saludos !!
>>
>> Eric.
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Gráfico al estilo heatmap, pero no heatmap XD

2021-01-07 Por tema Carlos Ortega
Hola,

Mira esto:

https://github.com/LKremer/ggpointdensity

Saludos,
Carlos Ortega
www.qualityexcellence.es

El jue, 7 ene 2021 a las 22:29, Eric () escribió:

> Que tal comunidad, tengo un problema al que le he dado vueltas para
> resolverlo con R y creo que he llegado a una solución, pero pienso que
> ya le debe haber pasado a alguien y que ya debe estar implementado en R.
> SIn embargo, me ha ido mal en mi búsqueda porque, a pesar de la simpleza
> del problema, al parecer tengo dificultades para describirlo
> correctamente así es que no doy con su solución en la web. Por eso vengo
> a preguntarle a inteligencias humanas, a ver si me entienden mejor que
> las IA de los buscadores XD. El problema es el siguiente:
>
> Tengo una matriz con varios miles de filas y dos columnas. Esas dos
> columnas las represento en un scatterplot que por tener muchos puntos
> juntos uno al lado, e incluso sobre el otro, se observa como una masa
> oscura sin una tendencia clara. Sin embargo, tengo un R2 de más de 0.5,
> así es que tan masa oscura no es, hay alguna tendencia en la relación de
> las variables, pero no se aprecia gráficamente. De modo que quisiera
> colorear el gráfico 2D de manera que aquellas zonas con más densidad de
> puntos sean más rojas y las con menos puntos sean más amarillas, por
> ejemplo. Pensé crear una tercera columna manualmente para aquellos casos
> en que haya un punto exactamente sobre otro, pero tengo el problema de
> que las variables son contínuas, de modo que un punto con exactamente
> las mismas coordenadas XY es raro, aunque están uno al ladito del otro.
>
> Así es que mi pregunta es si hay alguna librería en R que me resuelva el
> problema de colorear automáticamente el scatterplot de acuerdo a la
> densidad de puntos de un sector al estilo heatmap (heatmap no me sirve
> porque requiere que yo indique la tercera componente del gráfico XYZ
> para colorearlo).
>
> Como siempre muchas gracias por su atención y tiempo. Espero dar la mano
> de vuelta cuando me sea posible.
>
> Saludos !!
>
> Eric.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Fórmula con variables al azar

2021-01-07 Por tema Carlos Ortega
Hola,

Las diferencias con respecto a un random forest (no sé si usaste
randomForest o ranger) pueden venir del resto de parámetros (los valores
por defecto de rpart están en rpart.control() ) son diferentes a los de
random forest (al menos para los de ranger), por ejemplo número de
elementos a considerar en el split.

Gracias,
Carlos.


El jue, 7 ene 2021 a las 22:12, Manuel Mendoza ()
escribió:

> Gracias José Luis, y también a Carlos y a Juan. Respecto a lo que dices,
> José Luis, de usar un random forest, es que es eso lo que estoy
> programando, un RF. Tenía ya hecho el programa del bootstrap con árboles, y
> a partir de él he programado un RF. He solucionado el problema que tenía
> con lo que me ha dicho Carlos. Funciona bien, aunque me extraña que la
> correlación sobre las muestras OOB no mejore respecto al bootstrap,
> mientras que hecho con el paquete randomForest mejoraba sustancialmente.
> Os lo pongo aquí, tal cual, por si queréis echarle un ojo.
> Un saludo
>
> set.seed(5)
> data <- read.table(file="Data.csv",header=T,sep=",")
>
> colnames(data)
> p=19
> nreps<- 1000
>
> # Creamos una matriz vacía para guardar las predicciones de cada árbol:
> OOBpreds<- matrix(NA, nrow=nrow(data),
> ncol=nreps,dimnames=list(rownames(data)))
>
> target <- c('IFd')
> vars   <- setdiff(names(data), target)
>
> for (i in 1:nreps){
>   selected<-sample(1:nrow(data),size=floor((2/3)*nrow(data)),replace=T)
>   training<- data[selected,]
>   OOB<-data[-selected,]# El out of bag incluye las que no están en
> el training data set
>   num_vars <- floor(p/3)
>   vars_samp <- vars[ sample(1:length(vars), num_vars)]
>   fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse= "+")))
>   fit <- rpart(fmla, data = training)
>   OOBpreds[-selected, i]<-predict(fit, OOB)
>   if(i%%10==0){print(paste("Iteración ",i))} # i%%10==0 significa: el
> resto de dividir i entre 10 es 0
>   }
>
> ResOOB<-rowMeans(OOBpreds, na.rm=T) # se obtiene la media de todas las
> predicciones para cada muestra
> OOBBagging<-lm(data$IFd ~ ResOOB) # para calcular la correlación entre la
> predicción y la observación
> rsqOOBRT<-summary(OOBBagging)$adj.r.squared# R2
>
> windows();plot(data$IFd ~
> ResOOB,main=paste("R2=",round(rsqOOBRT,2)));abline(0,1,lty=2,col=2)
>
>
>
>
>
>
> El jue, 7 ene 2021 a las 11:03, José Luis Cañadas ()
> escribió:
>
>> Hola Manuel.
>> ¿No has pensado en hacer un randomforest, poniendo qeu use todos los
>> datos en cada muestra bootstrap y un porcentaje de las variables?
>>
>> El jue, 7 ene 2021 a las 1:42, Carlos Ortega ()
>> escribió:
>>
>>> Hola Manuel,
>>>
>>> Esta es una forma, uso el conjunto de datos "car90" que viene incluido en
>>> "rpart".
>>>
>>> #-
>>> library(rpart)
>>>
>>> data(car90)
>>> target <- c('Mileage')
>>> vars   <- setdiff(names(car90), target)
>>>
>>> num_loops <- 10
>>> for( i in 1:num_loops) {
>>>num_vars <- 6
>>>vars_samp <- vars[ sample(1:length(vars), num_vars)]
>>>fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse=
>>> "+")))
>>>fit <- rpart(fmla, data = car90)
>>>print(fit)
>>> }
>>>
>>> #-
>>>
>>> Se puede sofisticar esto, para capturar incluso la salida de cada
>>> iteración... :-).
>>>
>>> Gracias,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El mié, 6 ene 2021 a las 22:44, Manuel Mendoza (<
>>> mmend...@fulbrightmail.org>)
>>> escribió:
>>>
>>> > Muy buenas, hago un árbol de regresión (aunque podría ser cualquier
>>> otro
>>> > análisis) dentro de un loop y quiero que en cada vuelta coja un
>>> conjunto
>>> > distinto de variables. En la df hay 19 predictores pero quiero que
>>> utilice
>>> > solo 6 de ellos, al azar, cada vez. ¿Qué debería poner donde hay un
>>> > interrogante?
>>> >
>>> >   fit<- rpart(IFd ~ ? , data=training)
>>> >
>>> > Gracias, como siempre,
>>> > Manuel
>>> >
>>> > [[alternative HTML version deleted]]
>>> >
>>> > ___
>>> > R-help-es mailing list
>>> > R-help-es@r-project.org
>>> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>>> >
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>

-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Gráfico al estilo heatmap, pero no heatmap XD

2021-01-07 Por tema Eric
Que tal comunidad, tengo un problema al que le he dado vueltas para 
resolverlo con R y creo que he llegado a una solución, pero pienso que 
ya le debe haber pasado a alguien y que ya debe estar implementado en R. 
SIn embargo, me ha ido mal en mi búsqueda porque, a pesar de la simpleza 
del problema, al parecer tengo dificultades para describirlo 
correctamente así es que no doy con su solución en la web. Por eso vengo 
a preguntarle a inteligencias humanas, a ver si me entienden mejor que 
las IA de los buscadores XD. El problema es el siguiente:


Tengo una matriz con varios miles de filas y dos columnas. Esas dos 
columnas las represento en un scatterplot que por tener muchos puntos 
juntos uno al lado, e incluso sobre el otro, se observa como una masa 
oscura sin una tendencia clara. Sin embargo, tengo un R2 de más de 0.5, 
así es que tan masa oscura no es, hay alguna tendencia en la relación de 
las variables, pero no se aprecia gráficamente. De modo que quisiera 
colorear el gráfico 2D de manera que aquellas zonas con más densidad de 
puntos sean más rojas y las con menos puntos sean más amarillas, por 
ejemplo. Pensé crear una tercera columna manualmente para aquellos casos 
en que haya un punto exactamente sobre otro, pero tengo el problema de 
que las variables son contínuas, de modo que un punto con exactamente 
las mismas coordenadas XY es raro, aunque están uno al ladito del otro.


Así es que mi pregunta es si hay alguna librería en R que me resuelva el 
problema de colorear automáticamente el scatterplot de acuerdo a la 
densidad de puntos de un sector al estilo heatmap (heatmap no me sirve 
porque requiere que yo indique la tercera componente del gráfico XYZ 
para colorearlo).


Como siempre muchas gracias por su atención y tiempo. Espero dar la mano 
de vuelta cuando me sea posible.


Saludos !!

Eric.

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Fórmula con variables al azar

2021-01-07 Por tema Manuel Mendoza
Gracias José Luis, y también a Carlos y a Juan. Respecto a lo que dices,
José Luis, de usar un random forest, es que es eso lo que estoy
programando, un RF. Tenía ya hecho el programa del bootstrap con árboles, y
a partir de él he programado un RF. He solucionado el problema que tenía
con lo que me ha dicho Carlos. Funciona bien, aunque me extraña que la
correlación sobre las muestras OOB no mejore respecto al bootstrap,
mientras que hecho con el paquete randomForest mejoraba sustancialmente.
Os lo pongo aquí, tal cual, por si queréis echarle un ojo.
Un saludo

set.seed(5)
data <- read.table(file="Data.csv",header=T,sep=",")

colnames(data)
p=19
nreps<- 1000

# Creamos una matriz vacía para guardar las predicciones de cada árbol:
OOBpreds<- matrix(NA, nrow=nrow(data),
ncol=nreps,dimnames=list(rownames(data)))

target <- c('IFd')
vars   <- setdiff(names(data), target)

for (i in 1:nreps){
  selected<-sample(1:nrow(data),size=floor((2/3)*nrow(data)),replace=T)
  training<- data[selected,]
  OOB<-data[-selected,]# El out of bag incluye las que no están en
el training data set
  num_vars <- floor(p/3)
  vars_samp <- vars[ sample(1:length(vars), num_vars)]
  fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse= "+")))
  fit <- rpart(fmla, data = training)
  OOBpreds[-selected, i]<-predict(fit, OOB)
  if(i%%10==0){print(paste("Iteración ",i))} # i%%10==0 significa: el resto
de dividir i entre 10 es 0
  }

ResOOB<-rowMeans(OOBpreds, na.rm=T) # se obtiene la media de todas las
predicciones para cada muestra
OOBBagging<-lm(data$IFd ~ ResOOB) # para calcular la correlación entre la
predicción y la observación
rsqOOBRT<-summary(OOBBagging)$adj.r.squared# R2

windows();plot(data$IFd ~
ResOOB,main=paste("R2=",round(rsqOOBRT,2)));abline(0,1,lty=2,col=2)






El jue, 7 ene 2021 a las 11:03, José Luis Cañadas ()
escribió:

> Hola Manuel.
> ¿No has pensado en hacer un randomforest, poniendo qeu use todos los datos
> en cada muestra bootstrap y un porcentaje de las variables?
>
> El jue, 7 ene 2021 a las 1:42, Carlos Ortega ()
> escribió:
>
>> Hola Manuel,
>>
>> Esta es una forma, uso el conjunto de datos "car90" que viene incluido en
>> "rpart".
>>
>> #-
>> library(rpart)
>>
>> data(car90)
>> target <- c('Mileage')
>> vars   <- setdiff(names(car90), target)
>>
>> num_loops <- 10
>> for( i in 1:num_loops) {
>>num_vars <- 6
>>vars_samp <- vars[ sample(1:length(vars), num_vars)]
>>fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse=
>> "+")))
>>fit <- rpart(fmla, data = car90)
>>print(fit)
>> }
>>
>> #-
>>
>> Se puede sofisticar esto, para capturar incluso la salida de cada
>> iteración... :-).
>>
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El mié, 6 ene 2021 a las 22:44, Manuel Mendoza (<
>> mmend...@fulbrightmail.org>)
>> escribió:
>>
>> > Muy buenas, hago un árbol de regresión (aunque podría ser cualquier otro
>> > análisis) dentro de un loop y quiero que en cada vuelta coja un conjunto
>> > distinto de variables. En la df hay 19 predictores pero quiero que
>> utilice
>> > solo 6 de ellos, al azar, cada vez. ¿Qué debería poner donde hay un
>> > interrogante?
>> >
>> >   fit<- rpart(IFd ~ ? , data=training)
>> >
>> > Gracias, como siempre,
>> > Manuel
>> >
>> > [[alternative HTML version deleted]]
>> >
>> > ___
>> > R-help-es mailing list
>> > R-help-es@r-project.org
>> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>> >
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Proyecto Lucene

2021-01-07 Por tema Diego Martín
Estimados compañeros:

 Tened en cuenta que no está, desde
2018, disponible el paquete *solr* en CRAN. En su lugar está *solrium*,
véase: *https://cran.r-project.org/web/packages/solrium/index.html
* . El empleo
no es exactamente igual aunque en general es muy similar. Hay matices en
los parámetros de algunas funciones. Caso de *solr_search*, con *conn*,...

 Saludos.


El jue, 7 ene 2021 a las 19:48, Diego Martín ()
escribió:

> Buenas:
>
> Muchas gracias por la cuestión. Eso me ha hecho repensar el
> asunto en el que estoy. Sí, había visto Solr, pero pronto lo descarté para
> trabajar con él por dos razones: primero declara tener API para Python y
> Ruby, pero no hace la más mínima referencia a R. Segundo, es específico y
> había pensado mejor acudir directamente a Lucene, que tampoco hace
> referencia a R.
>
> Gracias a ti, Carlos, he visto que hay en CRAN un paquete
> llamado *solr*, que podría servir, y en la página: 
> *https://ropensci.org/blog/2014/01/27/solr/
> * , hay comentarios
> interesantes sobre cómo emplearlo. Bueno, es un comienzo. Voy a
> documentarme sobre esta librería y a tratar de ver si se ajusta para lo que
> busco.
>
>  Muchas gracias como siempre. Un abrazo.
>
> El jue, 7 ene 2021 a las 0:54, Carlos Ortega ()
> escribió:
>
>> Hola,
>>
>> ¿No te vale la conexión con SolR?.
>> SolR y Lucene son ya el mismo proyecto desde 2010...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El mié, 6 ene 2021 a las 23:06, Diego Martín ()
>> escribió:
>>
>>> Estimados compañeros:
>>>
>>>  He buscado y no he hallado una
>>> conexión disponible entre R y Lucene. ¿Alguno de ustedes conoce que
>>> exista
>>> como sí la hay con Python [1]?.
>>>
>>>   Muchas gracias.
>>>
>>> [1] PyLucene.
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Proyecto Lucene

2021-01-07 Por tema Diego Martín
Buenas:

Muchas gracias por la cuestión. Eso me ha hecho repensar el
asunto en el que estoy. Sí, había visto Solr, pero pronto lo descarté para
trabajar con él por dos razones: primero declara tener API para Python y
Ruby, pero no hace la más mínima referencia a R. Segundo, es específico y
había pensado mejor acudir directamente a Lucene, que tampoco hace
referencia a R.

Gracias a ti, Carlos, he visto que hay en CRAN un paquete
llamado *solr*, que podría servir, y en la página:
*https://ropensci.org/blog/2014/01/27/solr/
* , hay comentarios
interesantes sobre cómo emplearlo. Bueno, es un comienzo. Voy a
documentarme sobre esta librería y a tratar de ver si se ajusta para lo que
busco.

 Muchas gracias como siempre. Un abrazo.

El jue, 7 ene 2021 a las 0:54, Carlos Ortega ()
escribió:

> Hola,
>
> ¿No te vale la conexión con SolR?.
> SolR y Lucene son ya el mismo proyecto desde 2010...
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El mié, 6 ene 2021 a las 23:06, Diego Martín ()
> escribió:
>
>> Estimados compañeros:
>>
>>  He buscado y no he hallado una
>> conexión disponible entre R y Lucene. ¿Alguno de ustedes conoce que exista
>> como sí la hay con Python [1]?.
>>
>>   Muchas gracias.
>>
>> [1] PyLucene.
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Fórmula con variables al azar

2021-01-07 Por tema José Luis Cañadas
Hola Manuel.
¿No has pensado en hacer un randomforest, poniendo qeu use todos los datos
en cada muestra bootstrap y un porcentaje de las variables?

El jue, 7 ene 2021 a las 1:42, Carlos Ortega ()
escribió:

> Hola Manuel,
>
> Esta es una forma, uso el conjunto de datos "car90" que viene incluido en
> "rpart".
>
> #-
> library(rpart)
>
> data(car90)
> target <- c('Mileage')
> vars   <- setdiff(names(car90), target)
>
> num_loops <- 10
> for( i in 1:num_loops) {
>num_vars <- 6
>vars_samp <- vars[ sample(1:length(vars), num_vars)]
>fmla <- as.formula(paste(target, " ~ ", paste(vars_samp, collapse=
> "+")))
>fit <- rpart(fmla, data = car90)
>print(fit)
> }
>
> #-
>
> Se puede sofisticar esto, para capturar incluso la salida de cada
> iteración... :-).
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
> El mié, 6 ene 2021 a las 22:44, Manuel Mendoza (<
> mmend...@fulbrightmail.org>)
> escribió:
>
> > Muy buenas, hago un árbol de regresión (aunque podría ser cualquier otro
> > análisis) dentro de un loop y quiero que en cada vuelta coja un conjunto
> > distinto de variables. En la df hay 19 predictores pero quiero que
> utilice
> > solo 6 de ellos, al azar, cada vez. ¿Qué debería poner donde hay un
> > interrogante?
> >
> >   fit<- rpart(IFd ~ ? , data=training)
> >
> > Gracias, como siempre,
> > Manuel
> >
> > [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es