amostrar com reposição toda a informação da classe alvo , Y=1 para que tenha o mesmo tamanho da classe Y=0. apenas na amostra de treinamento
Enviado por Samsung MobileLeonard Mendonça de Assis <assis.leon...@gmail.com> escreveu:Vinícius o que você está chamando de reamostragem? []s Leonard de Assis http://about.me/ldeassis Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu: Pessoal, preciso tirar uma dúvida a respeito de regressão logistica. Tenho uma conjunto de dados, onde existe um grande desbalanceamento nas classes da variável resposta (meu evento Y=1 a ser modelado, possui poucas observações) O que fiz foi: separei 70% dos dados para amostra treino e 30% para teste. na amostra treino (70%): utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz com que as linhas desta classe fossem re-amostradas até que a classe com resposta Y=1 possui-se a mesma quantidade de linhas da classe (Y=0) Com minha base de amostra treino balanceada ajustei um modelo de regressão logistica na amostra teste(30%): calculei minhas probabilidades de respostas a partir das variáveis independentes da amostra teste. arbitrei um ponto de classificação de P_CHAP>= 0,7 para classificar meu evento como classe (Y_CHAP=1) e P_CHAP<0,7 classificar meu evento como Y_CHAP=0 Construi uma tabela de confusão comparando os resultados Y_CHAP e Y para comparar minha Sensitividade e 1-Especificidade. Dúvidas: A questão é que meus resultados estão muito ruins. Acredito que é a estrutura de dados. Estou sendo questionado a respeito da técnica de re-amostragem na amostra treino para equilibrar as classes. Pois o demandante acredita que é necessário algum tipo de correção do modelo(feito a re-amostragem no ajuste da amostra treino) ao aplica-lo no conjunto teste, que não sofreu nenhuma alteração. Alguém tem algum material que justifique o uso de re-amostragem nos dados da amostra treino? Abs. -- Vinicius Brito Rocha. Estatístico e Atuário (IM / UFRJ) Mestre em Pesquisa Operacional (COPPE / UFRJ) www.aplicademic.blogspot.com http://twitter.com/viniciusbritor "Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.