Re: [R-es] Paquete pdp

2018-01-20 Por tema Carlos Ortega
Hola,

Sí, y en la ayuda sobre el objeto que utiliza "partial()" también viene que
es posible...

object

A fitted model object of appropriate class (e.g., "gbm", "lm",
"randomForest", "train", etc.).

El 20 de enero de 2018, 13:55, Manuel Mendoza 
escribió:

>
> Acabo de encontrar que si sirve para gbm, por lo que no es esa la razón.
>
> Aquí: https://journal.r-project.org/archive/2017/RJ-2017-016/RJ-20
> 17-016.pdf
>
>
>
>
>
>
>
>
> Quoting Manuel Mendoza :
>
> Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico a
>> mis datos me da:
>>
>> Error in eval(stats::getCall(object)$data) : object 'x.data' not found.
>>
>> Os copio abajo un ejemplo de aplicación a un RF. El mio es de un boosted
>> regression trees (paquete gbm). No sé si esa puede ser la razón del error.
>> En el paquete pdp no especifica que sea solo para RF, aunque en los
>> ejemplos que encontré nunca eran de boosted ... Solo de RF y SVM.
>>
>> Gracias,
>> Manuel
>>
>>
>> library(pdp)
>> data (boston)  # load the boston housing data
>> set.seed(101)  # for reproducibility
>> boston.rf <- randomForest(cmedv ~ ., data = boston)
>>
>> # Partial dependence of cmedv on lstat and rm
>>
>> pd <- partial(boston.rf, pred.var = c("lstat", "rm"), chull = TRUE)
>>
>> head(pd)  # print first 6 rows
>> #> lstat  rm yhat
>> #> 1  7.5284 3.66538 24.13683
>> #> 2  8.2532 3.66538 23.24916
>> #> 3  8.9780 3.66538 23.13119
>> #> 4  9.7028 3.66538 22.13531
>> #> 5 10.4276 3.66538 20.62331
>> #> 6 11.1524 3.66538 20.51258
>>
>>
>>
>>
>>
>>
>>
>> Quoting Carlos Ortega :
>>
>> Hola,
>>>
>>> A "treesize()" le tienes que pasar como parámetro el objeto randomForest
>>> de
>>> tu modelo.
>>> Y obtiene el número de nodos de cada uno de los árboles que hayas
>>> indicado
>>> en el valor del parámetros "ntrees" de "randomForest". Por defecto
>>> "ntrees"
>>> tiene un valor de 500.
>>> Mira qué valor tiene "ntrees" en tu modelo "randomForest", que
>>> seguramente
>>> le hayas indicado un valor de 1000...
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El 17 de enero de 2018, 14:29, Manuel Mendoza 
>>> escribió:
>>>
>>> Buenas tardes a todos. El paquete randomForest tiene la función treesize,
 que es el nº de nodos. Me dan valores realmente elevados (en torno a
 1000),
 y eso me parece extraño. ¿sabéis si es así?
 Gracias,
 Manuel
 --
 Dr Manuel Mendoza
 Department of Biogeography and Global Change
 National Museum of Natural History (MNCN)
 Spanish Scientific Council (CSIC)
 C/ Serrano 115bis, 28006 MADRID
 Spain

 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es


>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>> --
>> Dr Manuel Mendoza
>> Department of Biogeography and Global Change
>> National Museum of Natural History (MNCN)
>> Spanish Scientific Council (CSIC)
>> C/ Serrano 115bis, 28006 MADRID
>> Spain
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Paquete pdp

2018-01-20 Por tema Manuel Mendoza


Acabo de encontrar que si sirve para gbm, por lo que no es esa la razón.

Aquí: https://journal.r-project.org/archive/2017/RJ-2017-016/RJ-2017-016.pdf







Quoting Manuel Mendoza :

Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo  
aplico a mis datos me da:


Error in eval(stats::getCall(object)$data) : object 'x.data' not found.

Os copio abajo un ejemplo de aplicación a un RF. El mio es de un  
boosted regression trees (paquete gbm). No sé si esa puede ser la  
razón del error. En el paquete pdp no especifica que sea solo para  
RF, aunque en los ejemplos que encontré nunca eran de boosted ...  
Solo de RF y SVM.


Gracias,
Manuel


library(pdp)
data (boston)  # load the boston housing data
set.seed(101)  # for reproducibility
boston.rf <- randomForest(cmedv ~ ., data = boston)

# Partial dependence of cmedv on lstat and rm

pd <- partial(boston.rf, pred.var = c("lstat", "rm"), chull = TRUE)

head(pd)  # print first 6 rows
#> lstat  rm yhat
#> 1  7.5284 3.66538 24.13683
#> 2  8.2532 3.66538 23.24916
#> 3  8.9780 3.66538 23.13119
#> 4  9.7028 3.66538 22.13531
#> 5 10.4276 3.66538 20.62331
#> 6 11.1524 3.66538 20.51258







Quoting Carlos Ortega :


Hola,

A "treesize()" le tienes que pasar como parámetro el objeto randomForest de
tu modelo.
Y obtiene el número de nodos de cada uno de los árboles que hayas indicado
en el valor del parámetros "ntrees" de "randomForest". Por defecto "ntrees"
tiene un valor de 500.
Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente
le hayas indicado un valor de 1000...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 17 de enero de 2018, 14:29, Manuel Mendoza 
escribió:


Buenas tardes a todos. El paquete randomForest tiene la función treesize,
que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000),
y eso me parece extraño. ¿sabéis si es así?
Gracias,
Manuel
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es





--
Saludos,
Carlos Ortega
www.qualityexcellence.es



--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Paquete pdp

2018-01-20 Por tema Manuel Mendoza


Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico  
a mis datos me da:


Error in eval(stats::getCall(object)$data) : object 'x.data' not found.

Os copio abajo un ejemplo de aplicación a un RF. El mio es de un  
boosted regression trees (paquete gbm). No sé si esa puede ser la  
razón del error. En el paquete pdp no especifica que sea solo para RF,  
aunque en los ejemplos que encontré nunca eran de boosted ... Solo de  
RF y SVM.


Gracias,
Manuel


library(pdp)
data (boston)  # load the boston housing data
set.seed(101)  # for reproducibility
boston.rf <- randomForest(cmedv ~ ., data = boston)

# Partial dependence of cmedv on lstat and rm

pd <- partial(boston.rf, pred.var = c("lstat", "rm"), chull = TRUE)

head(pd)  # print first 6 rows
#> lstat  rm yhat
#> 1  7.5284 3.66538 24.13683
#> 2  8.2532 3.66538 23.24916
#> 3  8.9780 3.66538 23.13119
#> 4  9.7028 3.66538 22.13531
#> 5 10.4276 3.66538 20.62331
#> 6 11.1524 3.66538 20.51258







Quoting Carlos Ortega :


Hola,

A "treesize()" le tienes que pasar como parámetro el objeto randomForest de
tu modelo.
Y obtiene el número de nodos de cada uno de los árboles que hayas indicado
en el valor del parámetros "ntrees" de "randomForest". Por defecto "ntrees"
tiene un valor de 500.
Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente
le hayas indicado un valor de 1000...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 17 de enero de 2018, 14:29, Manuel Mendoza 
escribió:


Buenas tardes a todos. El paquete randomForest tiene la función treesize,
que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000),
y eso me parece extraño. ¿sabéis si es así?
Gracias,
Manuel
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es





--
Saludos,
Carlos Ortega
www.qualityexcellence.es



--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es