Em 31/10/2011 18:32, Jose Claudio Faria escreveu:
Em 31 de outubro de 2011 15:39, Cesar Rabak<[email protected]>  escreveu:
José Cláudio,

O texto que você cita não abona o uso do teste de qui-quadrado para
freqüências relativas.

Foi exatamente a minha interpretação!

Se você pensar bem, isso vem da própria natureza do teste que usa a
distribuição qui-quadrado.

Imagine o famoso exemplo do número de nascimentos de crianças em dois
hospitais: um de uma cidade pequena com dez nascimentos por semana e um de
uma grande metrópole com cem nascimentos por semana.

O exemplo é muito bom!

No caso da cidade pequena, numa certa semana houve seis nascimentos de
meninas e quatro de meninos;

No caso da cidade grande numa certa semana houve sessenta nascimentos de
meninas e quarenta de meninos.

embora as proporções sejam iguais, o p-valor do teste para o 1º caso é 0,52
e para o segundo 0,045!!

No meu entendimento os testes feitos assim significam coisas diferentes:
1. Com os valores aobsolutos, testa a independência de linhas e colunas.

Na verdade, você pode testar mais do que a independência. Se você tiver uma distribuição de frequências esperadas você pode testar as suas observações contra ela.

Dois exemplos são a distribuição de resultados do jogo simultâneo de dois dados (onde o sete passa a ser o número mais frequente) ou a distribuição dos tipos de sangue de uma determinada população.

2. Com os dados em proporção testa a similaridade dos hospitais, ou
seja, se o nacimento de meninos e meninas independe do tamanho da
cidade.

Lamento: sem o "tamanho da cidade" == população, você estará brincando de cabra cega com o intervalo de confiança das suas proporções.

Imagine o problema das proporções como as pesquisas de intenção de voto: para determinar o erro padrão você precisa do tamanho da amostra...


Conclusão: Se proporções fossem usadas, você poderia escolher o seu p-valor
bastando escolher a base da proporção!

Não entendi muito bem a frase acima... poderia explanar de outra forma?

Dado que as proporções podem ser feitas em cima de uma base arbitrária, duas avaliações sobre as mesmas proporções podem dar p-valores diferentes, ora ultimadamente a escolha da base permitiria "decidir" qual p-valor obter...


meus 0,0199....

Nas esquinas da vida qualquer contribuição já alegra o dia...

Ivan,

Aproveitando o gancho do Cesar:
Acho que é mais por ai: o objetivo é testar a distribuição dos
estágios vegetativos de 4 ambientes (2 hospitais no exemplo do cesar)
(que são muito diferentes em termos de tamanho e abundância absoluta)
em relação a 4 variáveis preditoras (os estágios vegetativos). Ou
seja, o que importa é saber, independente do tamanho do ambiente
(cidade no exemplo do Cesar), se a distribuição dos estágios (meninos
e meninas no exemplo do Cesar) diferem ou não.

Ab,


--
Cesar Rabak
GNU/Linux User 52247.
Get counted: http://counter.li.org/
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Responder a