Hola. En principio podrías hacer sobremuestreo de tus FALSE. Teóricamente el sobre muestreo NO debería mejorar sustancialmente un modleo logístico y si se utiliza hay que corregir las estimaciones. Un par de referencias de los compañeros Raúl Vaquerizo y Carlos Gil, respectivamente
1- http://analisisydecision.es/el-sobremuestreo-%C2%BFmejora-mi-estimacion/ 2- https://www.datanalytics.com/2014/11/17/los-coeficientes-de-la-regresion-logistica-con-sobremuestreo/ Si sigues pensando en utilizar "oversampling" o "undersampling" mira la técnica SMOTE (crea ejemplos sintéticos de la clase minoritaria). está implementada en el paquete DMwR https://rdrr.io/cran/DMwR/ Saludos El 5 de enero de 2017, 13:28, Milagros Camacho Bellido < mila.camachobell...@gmail.com> escribió: > Hola Comunidad, Feliz Año 2017: > > > Tengo un problemilla con una regresión logística desbalanceada, tengo > demasiados TRUE (93%). ¿Sabría alguién alguna forma de corregir el problema > con R? > > > Un slaudo, > > > Milagros Camacho > > > > --- > El software de antivirus Avast ha analizado este correo electrónico en > busca de virus. > https://www.avast.com/antivirus > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es