Hola de nuevo,
Se me olvidó comentar que adicionalmente RF selecciona al azar las
variables explicativas en cada ajuste. Para más detalles recomendaría el
libro:
An Introduction to Statistical Learning
(http://www-bcf.usc.edu/~gareth/ISL; disponible de forma gratuita en
pdf), e incluso hacer e
Hola Gemma,
En principio con el random forest no tendrías mucho problema. En general
con pocos datos los métodos de aprendizaje estadístico / automático que
requieren de una muestra de aprendizaje y otra de validación podrían tener
problemas. En estos casos sería recomendable hacer bagging, remues
Hola,
Me he iniciado hace poco en Machine Learning, y tengo una duda sobre mis
conjuntos de datos: el primero tiene 37 variables explicativas y 116
instancias, y el segundo, 140 variables explicativas y 195 instancias. El
primero lo veo bien, ya que hay 3 veces más casos que variables
explicativas