Em 31/10/2011 18:32, Jose Claudio Faria escreveu:
Em 31 de outubro de 2011 15:39, Cesar Rabak<[email protected]> escreveu:
José Cláudio,
O texto que você cita não abona o uso do teste de qui-quadrado para
freqüências relativas.
Foi exatamente a minha interpretação!
Se você pensar bem, isso vem da própria natureza do teste que usa a
distribuição qui-quadrado.
Imagine o famoso exemplo do número de nascimentos de crianças em dois
hospitais: um de uma cidade pequena com dez nascimentos por semana e um de
uma grande metrópole com cem nascimentos por semana.
O exemplo é muito bom!
No caso da cidade pequena, numa certa semana houve seis nascimentos de
meninas e quatro de meninos;
No caso da cidade grande numa certa semana houve sessenta nascimentos de
meninas e quarenta de meninos.
embora as proporções sejam iguais, o p-valor do teste para o 1º caso é 0,52
e para o segundo 0,045!!
No meu entendimento os testes feitos assim significam coisas diferentes:
1. Com os valores aobsolutos, testa a independência de linhas e colunas.
Na verdade, você pode testar mais do que a independência. Se você tiver
uma distribuição de frequências esperadas você pode testar as suas
observações contra ela.
Dois exemplos são a distribuição de resultados do jogo simultâneo de
dois dados (onde o sete passa a ser o número mais frequente) ou a
distribuição dos tipos de sangue de uma determinada população.
2. Com os dados em proporção testa a similaridade dos hospitais, ou
seja, se o nacimento de meninos e meninas independe do tamanho da
cidade.
Lamento: sem o "tamanho da cidade" == população, você estará brincando
de cabra cega com o intervalo de confiança das suas proporções.
Imagine o problema das proporções como as pesquisas de intenção de voto:
para determinar o erro padrão você precisa do tamanho da amostra...
Conclusão: Se proporções fossem usadas, você poderia escolher o seu p-valor
bastando escolher a base da proporção!
Não entendi muito bem a frase acima... poderia explanar de outra forma?
Dado que as proporções podem ser feitas em cima de uma base arbitrária,
duas avaliações sobre as mesmas proporções podem dar p-valores
diferentes, ora ultimadamente a escolha da base permitiria "decidir"
qual p-valor obter...
meus 0,0199....
Nas esquinas da vida qualquer contribuição já alegra o dia...
Ivan,
Aproveitando o gancho do Cesar:
Acho que é mais por ai: o objetivo é testar a distribuição dos
estágios vegetativos de 4 ambientes (2 hospitais no exemplo do cesar)
(que são muito diferentes em termos de tamanho e abundância absoluta)
em relação a 4 variáveis preditoras (os estágios vegetativos). Ou
seja, o que importa é saber, independente do tamanho do ambiente
(cidade no exemplo do Cesar), se a distribuição dos estágios (meninos
e meninas no exemplo do Cesar) diferem ou não.
Ab,
--
Cesar Rabak
GNU/Linux User 52247.
Get counted: http://counter.li.org/
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.