[R-es] que tal comunidad, una pregunta del paquete data.table

2017-01-05 Por tema eric
si se tiene un data.table (DT), supongamos de 100 filas por 3 columnas 
de datos numericos, como puedo hacer para obtener el correspondiente 
valor de la columna 1 si busco, por ejemplo, el maximo de la columna 2 
agrupado por la columna 3 ?


para buscar el maximo de la columna 2 escribo.

DT[ , max(c2), by=c3 ]

muchas gracias,

saludos, eric.




--
Forest Engineer
Master in Environmental and Natural Resource Economics
Ph.D. student in Sciences of Natural Resources at La Frontera University
Member in AguaDeTemu2030, citizen movement for Temuco with green city 
standards for living


Nota: Las tildes se han omitido para asegurar compatibilidad con algunos 
lectores de correo.


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Regresión Logística desbalanceada

2017-01-05 Por tema José Luis Cañadas
Hola.
En principio podrías hacer sobremuestreo de tus FALSE. Teóricamente el
sobre muestreo NO debería mejorar sustancialmente un modleo logístico y si
se utiliza hay que corregir las estimaciones.  Un par de referencias de los
compañeros Raúl Vaquerizo y Carlos Gil, respectivamente

1- http://analisisydecision.es/el-sobremuestreo-%C2%BFmejora-mi-estimacion/
2-
https://www.datanalytics.com/2014/11/17/los-coeficientes-de-la-regresion-logistica-con-sobremuestreo/


Si sigues pensando en utilizar "oversampling" o "undersampling"  mira la
técnica SMOTE  (crea ejemplos sintéticos de la clase minoritaria). está
implementada en el paquete DMwR
https://rdrr.io/cran/DMwR/

Saludos

El 5 de enero de 2017, 13:28, Milagros Camacho Bellido <
mila.camachobell...@gmail.com> escribió:

> Hola Comunidad, Feliz Año 2017:
>
>
> Tengo un problemilla con una regresión logística desbalanceada, tengo
> demasiados TRUE (93%). ¿Sabría alguién alguna forma de corregir el problema
> con R?
>
>
> Un slaudo,
>
>
> Milagros Camacho
>
>
>
> ---
> El software de antivirus Avast ha analizado este correo electrónico en
> busca de virus.
> https://www.avast.com/antivirus
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Regresión Logística desbalanceada

2017-01-05 Por tema Carlos Ortega
Hola,

Sí, puedes balancear las clases de diferentes formas...
Mira lo que ofrece el paquete "caret" aquí:

http://topepo.github.io/caret/subsampling-for-class-imbalances.html


Saludos,
Carlos Ortega
www.qualityexcellence.es

El 5 de enero de 2017, 13:28, Milagros Camacho Bellido <
mila.camachobell...@gmail.com> escribió:

> Hola Comunidad, Feliz Año 2017:
>
>
> Tengo un problemilla con una regresión logística desbalanceada, tengo
> demasiados TRUE (93%). ¿Sabría alguién alguna forma de corregir el problema
> con R?
>
>
> Un slaudo,
>
>
> Milagros Camacho
>
>
>
> ---
> El software de antivirus Avast ha analizado este correo electrónico en
> busca de virus.
> https://www.avast.com/antivirus
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es