Re: [R-es] gbm.step para clasificación no binaria

2018-02-21 Por tema Carlos Ortega
​Si ya vas a utilizar "gbm", por justamente mejorar la capacidad predictiva, usaría el "gbm" de H2O o mejor "ligthgbm"... El porqué...​ https://github.com/szilard/GBM-perf Saludos, Carlos Ortega www.qualityexcellence.es El 21 de febrero de 2018, 10:49, Manuel Mendoza escribió: > > Bueno, final

Re: [R-es] gbm.step para clasificación no binaria

2018-02-21 Por tema Manuel Mendoza
Bueno, finalmente estaba equivocado en relación a la validación cruzada; resulta que gbm tiene el comando gbm.perf(gbm.model, method="cv") que te indica el mejor nº de árboles por VC. Lo pongo por si a alguien le pudiera interesar. Los gradient boosted son, sin duda, uno de los algoritmos

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Manuel Mendoza
Gracias, les echaré un ojo. Quoting Carlos Ortega : Hola, Varias cosas: - Puedes usar "gbm" y para los "partial plots" utilizar el paquete "pdp" que considera varios tipos de modelos, entre ellos "gbm". - También puedes usar "xgboost" que tiene una función parecida a esta que qui

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Carlos Ortega
Hola, Varias cosas: - Puedes usar "gbm" y para los "partial plots" utilizar el paquete "pdp" que considera varios tipos de modelos, entre ellos "gbm". - También puedes usar "xgboost" que tiene una función parecida a esta que quieres usar "xgb.cv" justamente para encontrar el modelo óp

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Manuel Mendoza
Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es f

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Manuel Mendoza
Bueno, primero te comento que si no le indico la family me hace Bernuilli y da error por no ser binaria. La razón de aplicar gbm.step del paquete dismo es que da una información fundamental, como la interacción entre las variables o los partial plots. La interacción te la representa en 3D

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Carlos Ortega
Hola, Sí, tienes razón... ¿No puedes usar la propia función "gbm" del paquete "gbm"?... Gracias, Carlos Ortega www.qualityexcellence.es El 19 de febrero de 2018, 18:01, Manuel Mendoza escribió: > > Gracias Carlos. Hasta donde yo entiendo si las hay: > > El argumento family puede ser: > > "gaus

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Manuel Mendoza
Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a posit

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Carlos Ortega
Hola, No hay ninguna limitación en la ayuda de la función en este sentido. Tan solo se indica que han de existir dos niveles en la variable predictora, vaya que al menos sea binaria... En la función en el parámetro "gbm.y" es donde indicas qué columna es la predictora. No hay otro parámetro donde

[R-es] gbm.step para clasificación no binaria

2018-02-19 Por tema Manuel Mendoza
Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no binaria? Gracias -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain ___