Carol
sugiro uma revisao de modelos lineares geeneralizados em algum texto
introdutorio que vai esclarecer muitas coisas
(por exemlo o livro Extending Linear Models in R)
Mas rapidamente:
O modelo linear que voce menciona y = a+bx
Pode ser reescrito como explicitando a distribuicao da resposta Y e
definindo uma funcao de sua média (no caso identidade) como uma funcao
linear de sua variavel explicativa
Y ~ N(mu, sigma^2)
E(Y) = mu = nu = a + bx
O GLM geeneraliza isto entao de 2 maneiras:
- a distribuição nao precisa ser normal
- a relacao de mu e nu nao precisa ser identidade
No seu caso:
Y ~ N(n, p)
E(Y) = p
log(p/(1-p)) = nu = a + bx
Quanto a comparar com modelo nulo é só ajustado e usar a funcao anova para
comparar, semelahnte aos lm no R
ex:
mod0 <- glm(y ~ 1, family = binomial)
mod1 <- glm(y ~ x, family = binomial)
anova(mod0, mod1)
On Tue, 17 Jan 2012, Caroline Figueiredo wrote:
Olá pessoal,
Estou com uma dúvida, que na verdade deve ser bem ridícula, mas realmente não
sei a resposta. A questão é a
seguinte:
Tenho dados binários como variável resposta ( 1 – vivo; 0 - morto), e
variáveis contínuas como explicativas, e vi
no The R book do Crawley que poderia usar GLM para construir um modelo, tendo
binomial como família. Usei o seguinte
código (os valores são fictícios, pois li meus dados direto da tabela, pois são
muitas linhas).
status<-c(0,1,0,1,1,1,1,1,0,1)
altura<-c(2.2,1.3,4.5,6.7,1.3,4.5,1.2,2.0,7.8,1.2)
newy<-c(5.5,1.2,7.8,1.4,1.3,2.3,3.2,1.3,6.7,1.4)
m1<-glm(status~altura+newy+altura*newy, binomial)
E o summary deu isso:
Call:
glm(formula = status ~ altura + newy + altura * newy, family = binomial)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.3122 0.1586 0.1969 0.2486 0.6394
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.24827 0.52797 0.470 0.63818
altura 0.80654 0.20006 4.032 5.54e-05 ***
newy 0.23918 0.05101 4.689 2.74e-06 ***
altura:newy -0.04578 0.01753 -2.611 0.00903 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1705.0 on 7191 degrees of freedom
Residual deviance: 1610.4 on 7188 degrees of freedom
AIC: 1618.4
Number of Fisher Scoring iterations: 7
Minha dúvida é a seguinte: Qual é a equação ajustada para esse modelo? P. ex.,
se fosse uma regressão linear o
modelo seria y~x, e a equação y=a + bx, mas e para esse modelo?
A outra dúvida é se poderia fazer uma anova para comparar esse modelo com o
modelo nulo, e qual teste poderia usar,
pois no exemplo do livro ele usa o test= chi, porém está comparando dois
modelos diferentes, e queria saber se
posso usar para comparar com o modelo nulo também. Bem é isso pessoal, espero
que possam me ajudar.
Obrigada,
Carol Figueiredo
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.