No no, eso lo he sacaod, es decir, tengo la matriz de confusi�n para las 
OK/NOK, lo que no entiendo es como extraer las conclusiones sobre el modelo, de 
cara a como afectan las variables. He seguido dos estrategias:

1-Crear arboles de clasificacion con las variables m�s importantes del random 
Forest, pero el modelo se empobrece bastante.
2- Sacar los partialPlot, para ver la influencia de cada variable, pero no 
termino de entender el significado del eje Y para estos gr�ficos. Por lo que he 
visto, con tu aportaci�n primera, es que es el porcentaje de Votos OK/NOK, pero 
me queda la duda de saber si el 1 es el OK y el -1 el NOK o al rev�s.

Gracias Carlos!
Jes�s
Date: Tue, 12 Apr 2016 10:28:44 +0200
Subject: Re: [R-es] Random Forest para clasificaci�n
From: c...@qualityexcellence.es
To: j.para.fernan...@hotmail.com
CC: r-help-es@r-project.org

Hola,
Entonces, por tu �ltima pregunta, tu duda no es realmente sobre el significado 
de "partialPlot" si no realmente si a la hora de hacer tu modelo, 
"randomForest" est� haciendo una buena o mala clasificaci�n. �Es as�?. Porque 
entonces lo que hay que aclarar es otra cosa.
Si lo que quieres determinar con precisi�n es si cuando "randomForest" (o 
cualquier otro modelo) te est� indicando que un individuo (una fila) pertenece 
o no a una clase determinada (en tu caso "OK" o "KO") lo que tienes que 
plantearte son otras cosas. Antes de hablar de ellas, prefiero confirmar 
contigo si es esto lo que buscas o no.
Saludos,Carlos Ortegawww.qualityexcellence.es

El 12 de abril de 2016, 10:17, Jes�s Para Fern�ndez 
<j.para.fernan...@hotmail.com> escribi�:




Gracias por la pronta respuesta, pero tras leer la contestaci�n de la gente, 
sigo sin entender muy bien la explicaci�n.

Le responden lo siguiente:
"Each point on the partial dependence plot is the average vote 
percentage in favor of the "Yes trees" class across all observations, 
given a fixed level of TRI.

It's not a probability of correct classification. It has absolutely 
nothing to do with accuracy, true negatives, and true positives.


When you see the phrase



  Values greater than TRI 30 begin to have a positive influence for 
classification in your model



is an puffed-up way of saying



  Values greater than TRI 30 begin to predict "Yes trees" more strongly than 
values lower than TRI 30"


    Es decir, que el eje Y es el total de votos de una clase frente a la otra, 
pero como est� codificado con -1 y +1, como se cual es la clase OK y la NOK?

Gracias
Jes�s
Date: Tue, 12 Apr 2016 10:04:15 +0200
Subject: Re: [R-es] Random Forest para clasificaci�n
From: c...@qualityexcellence.es
To: j.para.fernan...@hotmail.com
CC: r-help-es@r-project.org

Hola,
Aqu� tienes una explicaci�n:
http://stats.stackexchange.com/questions/121383/interpreting-y-axis-of-a-partial-dependence-plots

Saludos,Carlos Ortegawww.qualityexcellence.es
El 12 de abril de 2016, 7:13, Jes�s Para Fern�ndez 
<j.para.fernan...@hotmail.com> escribi�:
Buenas,



Cuando estoy haciendo un random Forest para clasificaci�n y hago el gr�fico 
partialPlot, siendo mi respuesta OK/NOK, me sale en el eje X el valor de la 
variable, pero en el eje Y me salen valores de entre -1 y 1. �Qu� significado 
tiene?



Adjunto un ejemplo:



https://www.dropbox.com/s/4b92lqxi3592r0d/Captura.JPG?dl=0





Gracias!!!



        [[alternative HTML version deleted]]




_______________________________________________

R-help-es mailing list

R-help-es@r-project.org

https://stat.ethz.ch/mailman/listinfo/r-help-es


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
                                          


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
                                          
        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Reply via email to