Si ya vas a utilizar "gbm", por justamente mejorar la capacidad
predictiva, usaría el "gbm" de H2O o mejor "ligthgbm"...
El porqué...
https://github.com/szilard/GBM-perf
Saludos,
Carlos Ortega
www.qualityexcellence.es
El 21 de febrero de 2018, 10:49, Manuel Mendoza
escribió:
>
> Bueno, final
Bueno, finalmente estaba equivocado en relación a la validación
cruzada; resulta que gbm tiene el comando gbm.perf(gbm.model,
method="cv") que te indica el mejor nº de árboles por VC. Lo pongo por
si a alguien le pudiera interesar. Los gradient boosted son, sin duda,
uno de los algoritmos
Gracias, les echaré un ojo.
Quoting Carlos Ortega :
Hola,
Varias cosas:
- Puedes usar "gbm" y para los "partial plots" utilizar el paquete "pdp"
que considera varios tipos de modelos, entre ellos "gbm".
- También puedes usar "xgboost" que tiene una función parecida a esta
que qui
Hola,
Varias cosas:
- Puedes usar "gbm" y para los "partial plots" utilizar el paquete "pdp"
que considera varios tipos de modelos, entre ellos "gbm".
- También puedes usar "xgboost" que tiene una función parecida a esta
que quieres usar "xgb.cv" justamente para encontrar el modelo óp
Hola de nuevo. Se me olvidaba la principal razón para utilizar
gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan
(a diferencia de los random forest o cualquier otro bootstrap) pero
gbm.step hace validación cruzada para determinar el nº óptimo de
árboles y evitarlo. Es f
Bueno, primero te comento que si no le indico la family me hace
Bernuilli y da error por no ser binaria.
La razón de aplicar gbm.step del paquete dismo es que da una
información fundamental, como la interacción entre las variables o los
partial plots. La interacción te la representa en 3D
Hola,
Sí, tienes razón...
¿No puedes usar la propia función "gbm" del paquete "gbm"?...
Gracias,
Carlos Ortega
www.qualityexcellence.es
El 19 de febrero de 2018, 18:01, Manuel Mendoza
escribió:
>
> Gracias Carlos. Hasta donde yo entiendo si las hay:
>
> El argumento family puede ser:
>
> "gaus
Gracias Carlos. Hasta donde yo entiendo si las hay:
El argumento family puede ser:
"gaussian" (for minimizing squared error); por lo que tiene que ser numérica
"bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
"poisson" (count outcomes; requires the response to be a posit
Hola,
No hay ninguna limitación en la ayuda de la función en este sentido.
Tan solo se indica que han de existir dos niveles en la variable
predictora, vaya que al menos sea binaria...
En la función en el parámetro "gbm.y" es donde indicas qué columna es la
predictora. No hay otro parámetro donde
Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no binaria?
Gracias
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain
___
10 matches
Mail list logo