Bom dia pessoal,
Trabalhando com uma variável de taxas que que apresenta muitos valores
baixos, fui aconselhado a transforma-la com aplicação de log normal antes
de buscar correlações...
A variável foi transformada e inserida no dataframe passando a apresentar
comportamento normal, no entanto
Log so para número maior que zero
Em 10/06/2015 10:00, Samuel luna de almeida samuelgru...@gmail.com
escreveu:
Bom dia pessoal,
Trabalhando com uma variável de taxas que que apresenta muitos valores
baixos, fui aconselhado a transforma-la com aplicação de log normal antes
de buscar
log(0) = -Inf
Veja que voce tem muitos zeros, mais que 25% dos teus dados,
visto que o 1o quartil ainda é zero
Não tenhosugestão específica mas acredito que voce poderia:
- ver se seus zeros são zeros mesmo ou valores censurados abaixo de um
cento limite de detecção
- sendo zeros mesmo eu
Muito obrigado Luis, Paulo e Luis!
São zero mesmo (locais onde não há casos para resultarem em taxas)...
Consegui gerar lm para a regressão espacial com os dados originais, com
muitos zeros, porém com a variável normalizada acho q o -inf impede...
Será q eu consigo considerar os -inf como zero
Não seria possível utilizar uma regressão Poisson, quasi-Poisson,
binomial negativa etc. nos dados originais? Você poderia indicar o
numerador da taxa como variável de resposta (inclusive zero, sem
resposta), e o denominador (pessoas-tempo em risco, ao algo assim) como
offset. No caso da
Se for o caso de dados censurados, há um pacote chamado NADA(NonDetects and
Data Analysis) no R, de autoria de Dennis R. Helsel, que apresenta bons
resultados.
Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br
escreveu:
log(0) = -Inf
Veja que voce tem muitos zeros, mais que
Mas se são casos, voce poderia ao inves de modelar as taxas com uma
distribuição para variáveis contínuas
usar as contagens mesmo com modelos binomiais ou Poisson (com offset de
população) ou binomial negativo.
Isto é geral é equivalente mas melhor que modelar as taxas
On Wed, 10 Jun 2015,
Obrigado pelas considerações mais uma vez.
Em 10 de junho de 2015 10:58, Paulo Justiniano paulo...@leg.ufpr.br
escreveu:
Mas se são casos, voce poderia ao inves de modelar as taxas com uma
distribuição para variáveis contínuas
usar as contagens mesmo com modelos binomiais ou Poisson (com
Como os dados são contínuos seria necessário considerar uma distribuição
contínua com mistura Bernoulli, veja uma proposta aqui:
http://jupiter.est.ufmg.br/~posgrad/mestrado/dissertacao_mestrado_zaida%20_quiroz.pdf
e um exemplo no script abaixo:
## hurdle model for zero-gamma (zero inflation
tente: log(x + 1)
Em Qua, 2015-06-10 às 10:34 -0300, Samuel luna de almeida escreveu:
Muito obrigado Luis, Paulo e Luis!
São zero mesmo (locais onde não há casos para resultarem em taxas)...
Consegui gerar lm para a regressão espacial com os dados originais,
com muitos zeros, porém
Obrigado pelas considerações mais uma vez.
Vou explorar as possibilidades que me apresentaram e tentar chegar na
regressão espacial que é um objetivo da minha an'alise.
Em 10 de junho de 2015 13:35, Samuel luna de almeida samuelgru...@gmail.com
escreveu:
Obrigado pelas considerações mais uma
11 matches
Mail list logo