[R-es] que tal comunidad, una pregunta del paquete data.table
si se tiene un data.table (DT), supongamos de 100 filas por 3 columnas de datos numericos, como puedo hacer para obtener el correspondiente valor de la columna 1 si busco, por ejemplo, el maximo de la columna 2 agrupado por la columna 3 ? para buscar el maximo de la columna 2 escribo. DT[ , max(c2), by=c3 ] muchas gracias, saludos, eric. -- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo. ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Regresión Logística desbalanceada
Hola. En principio podrías hacer sobremuestreo de tus FALSE. Teóricamente el sobre muestreo NO debería mejorar sustancialmente un modleo logístico y si se utiliza hay que corregir las estimaciones. Un par de referencias de los compañeros Raúl Vaquerizo y Carlos Gil, respectivamente 1- http://analisisydecision.es/el-sobremuestreo-%C2%BFmejora-mi-estimacion/ 2- https://www.datanalytics.com/2014/11/17/los-coeficientes-de-la-regresion-logistica-con-sobremuestreo/ Si sigues pensando en utilizar "oversampling" o "undersampling" mira la técnica SMOTE (crea ejemplos sintéticos de la clase minoritaria). está implementada en el paquete DMwR https://rdrr.io/cran/DMwR/ Saludos El 5 de enero de 2017, 13:28, Milagros Camacho Bellido < mila.camachobell...@gmail.com> escribió: > Hola Comunidad, Feliz Año 2017: > > > Tengo un problemilla con una regresión logística desbalanceada, tengo > demasiados TRUE (93%). ¿Sabría alguién alguna forma de corregir el problema > con R? > > > Un slaudo, > > > Milagros Camacho > > > > --- > El software de antivirus Avast ha analizado este correo electrónico en > busca de virus. > https://www.avast.com/antivirus > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Regresión Logística desbalanceada
Hola, Sí, puedes balancear las clases de diferentes formas... Mira lo que ofrece el paquete "caret" aquí: http://topepo.github.io/caret/subsampling-for-class-imbalances.html Saludos, Carlos Ortega www.qualityexcellence.es El 5 de enero de 2017, 13:28, Milagros Camacho Bellido < mila.camachobell...@gmail.com> escribió: > Hola Comunidad, Feliz Año 2017: > > > Tengo un problemilla con una regresión logística desbalanceada, tengo > demasiados TRUE (93%). ¿Sabría alguién alguna forma de corregir el problema > con R? > > > Un slaudo, > > > Milagros Camacho > > > > --- > El software de antivirus Avast ha analizado este correo electrónico en > busca de virus. > https://www.avast.com/antivirus > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es