Vinícius
o que você está chamando de reamostragem?
[]s
Leonard de Assis
http://about.me/ldeassis
Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:
Pessoal,
preciso tirar uma dúvida a respeito de regressão logistica.
Tenho uma conjunto de dados, onde existe um grande desbalanceamento
nas classes da variável resposta (meu evento Y=1 a ser modelado,
possui poucas observações)
O que fiz foi:
separei 70% dos dados para amostra treino e 30% para teste.
na amostra treino (70%):
* utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz
com que as linhas desta classe fossem re-amostradas até que a
classe com resposta Y=1 possui-se a mesma quantidade de linhas da
classe (Y=0)
* Com minha base de amostra treino balanceada ajustei um modelo de
regressão logistica
na amostra teste(30%):
* calculei minhas probabilidades de respostas a partir das variáveis
independentes da amostra teste.
* arbitrei um ponto de classificação de P_CHAP>= 0,7 para
classificar meu evento como classe (Y_CHAP=1) e P_CHAP<0,7
classificar meu evento como Y_CHAP=0
* Construi uma tabela de confusão comparando os resultados Y_CHAP e
Y para comparar minha Sensitividade e 1-Especificidade.
Dúvidas:
A questão é que meus resultados estão muito ruins. Acredito que é a
estrutura de dados.
* Estou sendo questionado a respeito da técnica de re-amostragem na
amostra treino para equilibrar as classes. Pois o demandante
acredita que é necessário algum tipo de correção do modelo(feito a
re-amostragem no ajuste da amostra treino) ao aplica-lo no
conjunto teste, que não sofreu nenhuma alteração.
Alguém tem algum material que justifique o uso de re-amostragem nos
dados da amostra treino?
Abs.
--
/Vinicius Brito Rocha./
/Estatístico e Atuário (IM / UFRJ)//
Mestre em Pesquisa Operacional (COPPE / UFRJ)/
www.aplicademic.blogspot.com <http://www.aplicademic.blogspot.com>
http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso
assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.