Não seria possível utilizar uma regressão Poisson, quasi-Poisson,
binomial negativa etc. nos dados originais? Você poderia indicar o
numerador da taxa como variável de resposta (inclusive zero, sem
resposta), e o denominador (pessoas-tempo em risco, ao algo assim) como
"offset". No caso da quasi-Poisson, nem seria necessário separar
numerador e denominador; você poderia passar diretamente a taxa.

Leonardo Ferreira Fontenelle[1]


Em Qua 10 jun. 2015, às 10:34, Samuel luna de almeida escreveu:
> Muito obrigado Luis, Paulo e Luis!
>
> São zero mesmo (locais onde não há casos para resultarem em taxas)...
>
> Consegui gerar lm para a regressão espacial com os dados originais,
> com muitos zeros, porém com a variável normalizada acho q o "-inf"
> impede...
>
> Será q eu consigo considerar os "-inf" como zero de algum modo? Ou `e
> o caso de encontrar um modelo/distribuição mais adequado mesmo?
>
> Agradecido, Samuel
>
> Em 10 de junho de 2015 10:07, Paulo Justiniano <paulo...@leg.ufpr.br>
> escreveu:
>>
>>
log(0) = -Inf
>>
>>
Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto que o
1o quartil ainda é zero
>>
>>
Não tenhosugestão específica mas acredito que voce poderia:
>>
- ver se seus zeros são zeros mesmo ou valores "censurados" abaixo de um
  cento limite "de detecção"
>>
>>
- sendo zeros mesmo eu procurar por algum modelo/distribuição que
  permitisse modelar esta proporção bem razoável de zeros que voce tem
  nos teus dados
>>
>>
>>
>>
>>
>>
On Wed, 10 Jun 2015, Samuel luna de almeida wrote:
>>
>>> Bom dia pessoal,
>>>
>>>
Trabalhando com uma variável de taxas que que apresenta muitos valores
baixos, fui aconselhado a transforma-la com aplicação de log normal
antes de buscar
>>>
correlações...
>>>
A variável foi transformada e inserida no dataframe  passando a
apresentar comportamento normal, no entanto apresenta alguns valores "-
inf" como pode ser visto no
>>>
summary copiado abaixo:
>>>
>>>
TX_J04_10         LOGNTX_J04
>>>
Min.   :   0.0       Min.   :-Inf
>>>
1st Qu.:   0.0     1st Qu.:-Inf
>>>
Median : 138.4    Median :  -4
>>>
Mean   : 240.7    Mean   :-Inf
>>>
3rd Qu.: 295.2    3rd Qu.:  -4
>>>
Max.   :9626.1    Max.   :   0
>>>
>>>
Acredito que seja por isso que não estou conseguindo gerar lm para rodar
regressão espacial, veja o erro que aparece:
>>>
>>>
> baseGN04_lm <- lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)
>>>
Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
>>>
NA/NaN/Inf in 'y'
>>>
>>>
Será que é por isso mesmo, alguém poderia me indicar uma resolução?
>>
>> _______________________________________________
>>
R-br mailing list
>> R-br@listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
código mínimo reproduzível.
>
> _________________________________________________
> R-br mailing list R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia
> de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo
> reproduzível.



Links:

  1. http://lattes.cnpq.br/9234772336296638
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Responder a