Hola, espero ser clara en el mensaje ya que es la primera vez que recurro a este tipo de ayudas, explico mi duda:
Tengo un dataset con 4505 observaciones en el que la variable dependiente son presencias (n=97 y clasificadas como 1) y ausencias (n=4408 y clasificadas como 0). Mi primer paso fue realizar un GLM con una muestra compensada de ausencias y presencias para la variable dependiente, es decir 97 presencias y 97 ausencias. Sin embargo, como todo lo que tengo son ausencias y no pseudoausencias me recomendaron utilizar las 97 presencias frente a todas las ausencias, aquí viene el problema. Si realizo un GLM con ausencia/presencia como variable dependiente no siendo ésta proporcional entre 1 y 0 debo ponderar las observaciones, lo cuál creo que se realiza añadiendo el vector "weights" a la función, quedando asi: modelo <- glm(v_dependiente ~ v1 + v2 + v3, data = datset, weights="x", family = binomial (link=logit) Mi duda es cómo calcular el factor de ponderación de las presencias y las ausencias para crear el vector que pueda introducir en la función weights. Muchas gracias! Un saludo *-------------* *Isabel García Barón* [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es