Re: [R-es] [data[,1]==1, 2]

2018-02-02 Por tema Manuel Mendoza


Ah, ya lo veo; te devuelve la segunda columna de data que cumple la  
condición de que la primera columna sea igual a 1.

Se ve más claro si la 2ª columna no son 0 y 1 también.

data <- data.frame(x = sample(c(0,1),10, replace = TRUE),
   y = sample(c(1:20),10, replace = F))
Gracias


Quoting Carlos Ortega :


Hola,


   - *[data[,1] ==1, 2]*
   - Esto no tiene sentido...
   - si lo que querías decir era *data[data[,1] == 1, 2] *mira el
   ejemplo y lo destacado...



data <- data.frame(

+x = sample(c(0,1),10, replace = TRUE),
+y = sample(c(0,1),10, replace = TRUE)
+   )

data

   x y
1  0 1
2  0 1
3  0 0
4  *1 0*
5  *1 1*
6  *1 1*
7  0 0
8  0 1
9  0 1
10 0 1

data[data[,1]==1, 2]

[1] 0 1 1

Saludos,
Carlos Ortega
www.qualityexcellence.es



El 1 de febrero de 2018, 19:04, Manuel Mendoza 
escribió:



Algo muy sencillo: ¿cómo leeríais esto [data[,1]==1, 2]?
Gracias



Quoting Manuel Mendoza :

Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día de

reyes a la 1.20h y me contestas a las 2.45h)

Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En un
RF para clasificación me da valores parecidos a los de tu ejemplo, y en
otro para regresión, valores de y entre 45 y 55.

Para regresión, el último parámetro no puede ser una categoría, como
"versicolor". Yo puse la variable entrecomillada, pensando que era el
nombre del eje x, pero he probado a poner otra cosa, y lo ignora; lo he
quitado y no afecta. Pensé que podría ser el valor de la variable respuesta
más esperado, en función del valor del predictor, pero no se mueve en el
mismo rango.

Voy a ver el paquete pdp del que me hablas.

Gracias nuevamente,

Manuel


Quoting Carlos Ortega :

Hola,


Ya es que la explicación de la función es un tanto oscura...

Mira el ejemplo (clasificación):

data(iris)

set.seed(543)
iris.rf <- randomForest(Species~., iris)
partialPlot(iris.rf, iris, Petal.Width, "versicolor")



Y el gráfico que se produce:

[image: Imágenes integradas 1]
El gráfico mide la variación de la probabilidad sobre una de las clases
de
la variable target (en este caso la variable target es "Species" y la
clase
es "versicolor") de acuerdo a cómo varía la variable de estudio, en este
caso "Petal.Width". El gráfico te indica que valores de Petal.Width
cercanos a 1.0 se obtiene el máximo de probabilidad de que Species sea
"versicolor".

Y algo parecido para cuando tienes un modelo de "regresión".

No sé ese "VR" que comentas en tu duda de dónde sale...

Si estás interesado en este tema, mira también el paquete  "pdp".

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 7 de enero de 2018, 1:21, Manuel Mendoza 
escribió:



Hola erreros. A ver si alguien podría decirme qué son los dos ejes del
plot que resulta de aplicar partialPlot en un Randomforest.

Encuentro que:

Partial dependence plot gives a graphical depiction of the marginal
effect
of a variable on the class probability (classification) or response
(regression)

que nos indica como varía la VR en función de la variable considerada,
manteniendo el resto de variables fijas.

No encuentro lo que es esa VR por ningún sitio (varianza?), ni la
explicación de qué son los dos ejes.

Gracias,
Manuel


--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es





--
Saludos,
Carlos Ortega
www.qualityexcellence.es




--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es




--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es





--
Saludos,
Carlos Ortega
www.qualityexcellence.es



--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] [data[,1]==1, 2]

2018-02-01 Por tema Manuel Mendoza

Tienes razón, Carlos, en el copia y pega me dejé un "data".

Voy a ver lo que me mandas.
Gracias, como siempre.
Manuel



Quoting Carlos Ortega :


Hola,


   - *[data[,1] ==1, 2]*
   - Esto no tiene sentido...
   - si lo que querías decir era *data[data[,1] == 1, 2] *mira el
   ejemplo y lo destacado...



data <- data.frame(

+x = sample(c(0,1),10, replace = TRUE),
+y = sample(c(0,1),10, replace = TRUE)
+   )

data

   x y
1  0 1
2  0 1
3  0 0
4  *1 0*
5  *1 1*
6  *1 1*
7  0 0
8  0 1
9  0 1
10 0 1

data[data[,1]==1, 2]

[1] 0 1 1

Saludos,
Carlos Ortega
www.qualityexcellence.es



El 1 de febrero de 2018, 19:04, Manuel Mendoza 
escribió:



Algo muy sencillo: ¿cómo leeríais esto [data[,1]==1, 2]?
Gracias



Quoting Manuel Mendoza :

Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día de

reyes a la 1.20h y me contestas a las 2.45h)

Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En un
RF para clasificación me da valores parecidos a los de tu ejemplo, y en
otro para regresión, valores de y entre 45 y 55.

Para regresión, el último parámetro no puede ser una categoría, como
"versicolor". Yo puse la variable entrecomillada, pensando que era el
nombre del eje x, pero he probado a poner otra cosa, y lo ignora; lo he
quitado y no afecta. Pensé que podría ser el valor de la variable respuesta
más esperado, en función del valor del predictor, pero no se mueve en el
mismo rango.

Voy a ver el paquete pdp del que me hablas.

Gracias nuevamente,

Manuel


Quoting Carlos Ortega :

Hola,


Ya es que la explicación de la función es un tanto oscura...

Mira el ejemplo (clasificación):

data(iris)

set.seed(543)
iris.rf <- randomForest(Species~., iris)
partialPlot(iris.rf, iris, Petal.Width, "versicolor")



Y el gráfico que se produce:

[image: Imágenes integradas 1]
El gráfico mide la variación de la probabilidad sobre una de las clases
de
la variable target (en este caso la variable target es "Species" y la
clase
es "versicolor") de acuerdo a cómo varía la variable de estudio, en este
caso "Petal.Width". El gráfico te indica que valores de Petal.Width
cercanos a 1.0 se obtiene el máximo de probabilidad de que Species sea
"versicolor".

Y algo parecido para cuando tienes un modelo de "regresión".

No sé ese "VR" que comentas en tu duda de dónde sale...

Si estás interesado en este tema, mira también el paquete  "pdp".

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 7 de enero de 2018, 1:21, Manuel Mendoza 
escribió:



Hola erreros. A ver si alguien podría decirme qué son los dos ejes del
plot que resulta de aplicar partialPlot en un Randomforest.

Encuentro que:

Partial dependence plot gives a graphical depiction of the marginal
effect
of a variable on the class probability (classification) or response
(regression)

que nos indica como varía la VR en función de la variable considerada,
manteniendo el resto de variables fijas.

No encuentro lo que es esa VR por ningún sitio (varianza?), ni la
explicación de qué son los dos ejes.

Gracias,
Manuel


--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es





--
Saludos,
Carlos Ortega
www.qualityexcellence.es




--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es




--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es





--
Saludos,
Carlos Ortega
www.qualityexcellence.es



--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] [data[,1]==1, 2]

2018-02-01 Por tema Manuel Mendoza


Algo muy sencillo: ¿cómo leeríais esto [data[,1]==1, 2]?
Gracias



Quoting Manuel Mendoza :

Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día  
de reyes a la 1.20h y me contestas a las 2.45h)


Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10?  
En un RF para clasificación me da valores parecidos a los de tu  
ejemplo, y en otro para regresión, valores de y entre 45 y 55.


Para regresión, el último parámetro no puede ser una categoría, como  
"versicolor". Yo puse la variable entrecomillada, pensando que era  
el nombre del eje x, pero he probado a poner otra cosa, y lo ignora;  
lo he quitado y no afecta. Pensé que podría ser el valor de la  
variable respuesta más esperado, en función del valor del predictor,  
pero no se mueve en el mismo rango.


Voy a ver el paquete pdp del que me hablas.

Gracias nuevamente,

Manuel


Quoting Carlos Ortega :


Hola,

Ya es que la explicación de la función es un tanto oscura...

Mira el ejemplo (clasificación):


data(iris)
set.seed(543)
iris.rf <- randomForest(Species~., iris)
partialPlot(iris.rf, iris, Petal.Width, "versicolor")


Y el gráfico que se produce:

[image: Imágenes integradas 1]
El gráfico mide la variación de la probabilidad sobre una de las clases de
la variable target (en este caso la variable target es "Species" y la clase
es "versicolor") de acuerdo a cómo varía la variable de estudio, en este
caso "Petal.Width". El gráfico te indica que valores de Petal.Width
cercanos a 1.0 se obtiene el máximo de probabilidad de que Species sea
"versicolor".

Y algo parecido para cuando tienes un modelo de "regresión".

No sé ese "VR" que comentas en tu duda de dónde sale...

Si estás interesado en este tema, mira también el paquete  "pdp".

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 7 de enero de 2018, 1:21, Manuel Mendoza 
escribió:



Hola erreros. A ver si alguien podría decirme qué son los dos ejes del
plot que resulta de aplicar partialPlot en un Randomforest.

Encuentro que:

Partial dependence plot gives a graphical depiction of the marginal effect
of a variable on the class probability (classification) or response
(regression)

que nos indica como varía la VR en función de la variable considerada,
manteniendo el resto de variables fijas.

No encuentro lo que es esa VR por ningún sitio (varianza?), ni la
explicación de qué son los dos ejes.

Gracias,
Manuel


--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es





--
Saludos,
Carlos Ortega
www.qualityexcellence.es



--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es