[R-br] DESDOBRAMENTO DE UM FATORIAL TRIPLO

2013-01-07 Thread Tiago Souza Marçal

Boa tarde pessoal,
Estou tentando desdobrar a interação tripla do exemplo abaixo, entretanto, as 
somas de quadrado e os graus de liberdade estão dando 0.
Ex:
anos<-c(rep(1,144),rep(2,144))
ambientes<-c(rep(1,48),rep(2,48),rep(3,48),rep(1,48),rep(2,48),rep(3,48))
genotipos<-c(rep(c(rep(1,6),rep(2,6),rep(3,6),rep(4,6),rep(5,6),rep(6,6),rep(7,6),rep(8,6)),6))
blocos<-c(rep(c(1,2,3,4,5,6),48))
resp<-c(195,196,192,208,180,213,216,194,198,209,238,236,307,341,305,316,335,340,435,403,499,422,487,483,218,192,222,221,218,219,227,422,429,448,463,461,134,178,188,285,294,295,707,803,828,714,848,808,141,153,168,270,146,250,244,134,142,253,261,234,342,359,349,359,369,330,448,465,431,449,459,440,243,163,250,244,210,231,246,440,444,454,462,464,141,154,172,269,249,259,759,840,838,741,845,806,569,460,433,373,480,384,490,191,406,500,424,314,842,703,881,804,912,929,739,749,629,630,848,721,931,849,988,880,893,993,290,204,380,311,215,295,190,109,239,137,200,146,200,218,132,249,235,202,294,324,386,382,319,395,625,620,719,619,627,620,626,540,668,662,639,575,882,984,994,796,802,709,525,515,540,409,589,467,180,256,260,198,292,109,365,372,364,274,396,302,929,783,894,866,772,872,130,394,399,203,387,213,211,396,192,208,234,238,303,442,302,316,332,449,436,608,492,429,487,489,218,393,225,220,214,217,226,424,426,541,462,467,139,279,389,288,296,298,701,801,823,913,849,805,195,390,199,239,217,180,306,380,488,372,309,375,502,534,514,726,682,459,273,324,278,296,302,293,304,315,316,337,291,312,273,355,286,283,331,403,305,296,283,318,309,481,283,255,306,313,274,484)
dados<-data.frame(anos,ambientes,genotipos,blocos,resp)

#Estou usando os seguintes comandos:
anos<-factor(anos)
ambientes<-factor(ambientes)
genotipos<-factor(genotipos)
blocos<-factor(blocos)
av<-aov(resp~anos*ambientes/genotipos+(anos:ambientes:blocos)) 
des.tab<-sapply(paste("anos:ambientes", levels(anos:ambientes), sep=""), 
simplify=F, grep, x=names(coef(av)[av$assign==4]))
des.tab1<-summary(av, split=list("anos:ambientes:genotipos"=des.tab))

Agradeço desde já por qualquer ajuda.
Att.
Tiago. 

  ___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] Desdobramento de um fatorial triplo

2019-11-11 Thread R-br
Caros,
Peço auxilio para um problema de um fatorial em que há um problema em
atender aos pressupostos.

Agradeço alguma sugestão.

Maurício

m_seca_raiz = c(0.0, 0.0, 0.00046, 0.0,
0.0, 0.00014,
0.0, 0.00030, 0.00015, 0.0,
0.00012, 0.00050,
0.00056, 0.00030, 0.0, 0.00016,
0.00016, 0.00060,
0.00020, 0.00020, 0.00044, 0.0,
0.8, 0.00024,
0.00038, 0.8, 0.0, 0.00025,
0.00096, 0.00080,
0.00032, 0.00076, 0.00092, 0.00037,
0.00072, 0.00054,
0.00044, 0.00062, 0.00010, 0.00060,
0.00020, 0.00028,
0.0, 0.00052, 0.00048, 0.0,
0.00028, 0.00028,
0.00080, 0.00028, 0.0, 0.00068,
0.00070, 0.00038,
0.0, 0.00036, 0.00030, 0.00034,
0.00028, 0.00036,
0.00034, 0.00178, 0.00025, 0.00026,
0.00030, 0.00028,
0.00016, 0.00012, 0.000125000, 0.8,
0.00022, 0.00032)
meio = factor((rep(c("m2","m3"),each=12, times=3)))
sacarose = factor(rep(c("7,5","15,0","30,0"), each=24))
carvão = factor((rep(c("c1","c2"),each=6, times=6)))
tratamento = meio:sacarose:carvão
head(data.frame(m_seca_raiz, meio, sacarose, carvão, tratamento),18)


hist(m_seca_raiz)
boxplot(m_seca_raiz ~ tratamento,ylab="Massa seca da raiz",
xlab="Tratamento",
cex.axis=0.85 )

max(m_seca_raiz)

modelo_m_seca_raiz = aov(m_seca_raiz ~ tratamento)
summary(modelo_m_seca_raiz)

hist(modelo_m_seca_raiz$residuals)
shapiro.test(modelo_m_seca_raiz$residuals)
require(car)
leveneTest(modelo_m_seca_raiz$residuals ~ tratamento)

anova(modelo_m_seca_raiz)$'Mean Sq'[2]
res_pad_m_seca_raiz =
modelo_m_seca_raiz$residuals/sqrt(anova(modelo_m_seca_raiz)$'Mean Sq'[2])
plot(modelo_m_seca_raiz$fitted.values,  res_pad_m_seca_raiz, ylim = c(-5,5))
abline(h=c(-3,3),lty=3)

#Elimando a observação 62
shapiro.test(modelo_m_seca_raiz$residuals[-62])
leveneTest(modelo_m_seca_raiz$residuals[-62] ~ tratamento[-62])

#Transformação Box-Cox
require(forecast)
#require(fpp)
BoxCox.lambda(m_seca_raiz+0.5, method = "guerrero", lower=-3,upper = 3)
BoxCox.lambda(m_seca_raiz+0.5, method = "loglik", lower=-3,upper = 3)
#lambda = BoxCox.lambda(m_seca_raiz,lower=-3)
#lambda
m_seca_raizt = BoxCox(m_seca_raiz+0.5, lambda=-3)

hist(m_seca_raizt)
boxplot(m_seca_raizt ~ tratamento, ylab="m_seca_raiz (transformada)",
xlab="Tratamentos")
modelo_m_seca_raizt = aov(m_seca_raizt ~ tratamento)
summary(modelo_m_seca_raizt)
hist(modelo_m_seca_raizt$residuals)
plot(modelo_m_seca_raizt$residuals)
plot(modelo_m_seca_raizt$fitted.values,  modelo_m_seca_raizt$residuals)
shapiro.test(modelo_m_seca_raizt$residuals)
leveneTest(modelo_m_seca_raizt$residuals ~tratamento)


anova(modelo_m_seca_raizt)$'Mean Sq'[2]
res_pad_m_seca_raizt =
modelo_m_seca_raizt$residuals/sqrt(anova(modelo_m_seca_raizt)$'Mean Sq'[2])
plot(modelo_m_seca_raizt$fitted.values,  res_pad_m_seca_raizt, ylim =
c(-6,6))
abline(h=c(-3,3),lty=3)
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] DESDOBRAMENTO DE UM FATORIAL TRIPLO

2013-01-08 Thread Tiago Souza Marçal

Muito obrigado Walmes, estava tentando com os comandos antigos a muito tempo. 
Com relação  ao F, o testador dos fatores ano, ambientes e da interação anos X 
ambientes e o QM(anos X ambientes X bloco), portanto, eu refiz o quadro de 
anova. 
Mas eu creio que o testador do desdobramento é o QMresíduo já que ele é o 
testador da interação tripla. 
A propósito Walmes, acho muito interessante aquele gráfico da interação simples 
que você postou no dicas ridículas, você acha que seria possível fazer o mesmo 
com a interação tripla?  
Att.
Tiago.
Date: Tue, 8 Jan 2013 18:00:47 -0200
From: walmeszevi...@gmail.com
To: r-br@listas.c3sl.ufpr.br
Subject: Re: [R-br] DESDOBRAMENTO DE UM FATORIAL TRIPLO

Exigiu apenas uma modificação do código porque você tá desdobrando um fator 
dentro da combinação dos níveis de dois fatores,

# blocos devem vir antes nas fórmulas
av <- aov(resp~anos*ambientes/(blocos+genotipos))

anova(av) # nem todo F tá com denominador correto

names(coef(av))
pattern <- c(outer(levels(anos), levels(ambientes),
   function(x,y) paste("anos",x,":ambientes",y,":",sep="")))


des.tab <- sapply(pattern, simplify=FALSE,
  grep, x=names(coef(av)[av$assign==5]))

summary(av, split=list("anos:ambientes:genotipos"=des.tab))

À disposição.
Walmes.

==Walmes
 Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 
W)Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573VoIP: (3361 3600) 1053 1173
e-mail: wal...@ufpr.br
skype: walmeszevianitwitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmeslinux user number: 531218
==


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.  ___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] DESDOBRAMENTO DE UM FATORIAL TRIPLO

2013-01-08 Thread Walmes Zeviani
Acredito que você possa adaptar e usar o mesmo tipo de gráfico sim.

À disposição.
Walmes.

==
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: wal...@ufpr.br
skype: walmeszeviani
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] DESDOBRAMENTO DE UM FATORIAL TRIPLO

2013-01-08 Thread Tiago Souza Marçal

Ok. 
Obrigado Walmes.
Att.
Tiago.

Date: Wed, 9 Jan 2013 00:28:14 -0200
From: walmeszevi...@gmail.com
To: r-br@listas.c3sl.ufpr.br
Subject: Re: [R-br] DESDOBRAMENTO DE UM FATORIAL TRIPLO

Acredito que você possa adaptar e usar o mesmo tipo de gráfico sim.

À disposição.
Walmes.
==
Walmes Marques ZevianiLEG (Laboratório de Estatística e Geoinformação, 
25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paranáfone: (+55) 41 3361 
3573
VoIP: (3361 3600) 1053 1173e-mail: wal...@ufpr.br

skype: walmeszevianitwitter: @walmeszevianihomepage: 
http://www.leg.ufpr.br/~walmes
linux user number: 
531218==



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.  ___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Desdobramento de um fatorial triplo

2019-11-18 Thread Walmes Zeviani por (R-br)
Sem maiores esclarecimentos sobre os dados, análise, etc, o problema parece
ser apenas uma observação com valor extremo se comparado com as demais. Ela
salta aos olhos já na análise exploratória. Daí a importância de uma boa
análise exploratória. Ainda que seja composta de gráficos simples, negar a
sua utilidade e partir para a análise sem ver de fato os dados pode gerar
preocupações e escrita de código desnecessários.

Aproveitando o ensejo, eu tenho uma posição de reserva com relação a
aplicação de sequencias de testes para a avaliação dos pressupostos. Eu
tenho preferência pela análise visual porque ela dá um panorama amplo e
detalhado da condição dos pressupostos com sugestões de curso de ação (é um
outlier? é relação média variância? é assimetria?). Eu considero a análise
de dados uma tarefa artesanal, por isso não se pode deixar de aplicar no
olhar clínico do analista. Por outro lado, se fosse para automatizar a
análise de dados como análise em fluxo contínuo de várias respostas, ou
análise diária, grande volume de dados, pouco tempo disponível, extrema
necessidade de eliminar subjetividade (como se estivesse diante de uma
corte), etc etc, aí eu usaria tais testes como pré-teste para que não seja
necessário correr a todo momento a análise diagnóstico pente fino.

da <- data.frame(m_seca_raiz, meio, sacarose, carvão, tratamento)

# Ocorrência dos pontos experimentais.
ftable(xtabs(~meio + sacarose + carvão, data = da))

library(lattice)

# Inspeção dos dados antes da análise.
xyplot(m_seca_raiz ~ sacarose | carvão,
   groups = meio,
   auto.key = TRUE,
   data = da,
   type = c("p", "a"))

# ATTENTION: Análise exploratória revela um ponto suspeito na cela
# c1:30,0:m3. Existe conhecimento de algo que tenha provocado um valor
# maior? E.g. parcela comprometida, erro de dosagem, erro de mensuração,
# etc?

# Valor extremo será eliminado. Isso não complica a análise.
m0 <- lm(m_seca_raiz ~ sacarose * carvão * meio,
 data = da,
 subset = m_seca_raiz < 0.0015)

par(mfrow = c(2, 2))
plot(m0)
layout(1)

# NOTE: Pressupostos OK! Apenas uma muito sutil indicação de relação
# média variância mas que não é alarmante.

# Verifica sugestão de transformação.
range(m0$model[, 1])
MASS::boxcox(update(m0, . + 0.1 ~ .))
abline(v = 0.5, col = "red")

# Transformar por raíz deve melhorar quase nada, todavia, vamos
# experimentar.
m1 <- lm((m_seca_raiz + 0.1)^0.5 ~ sacarose * carvão * meio,
 data = da,
 subset = m_seca_raiz < 0.0015)

par(mfrow = c(2, 2))
plot(m1)
layout(1)

# NOTE: leve melhoria na relação média-variância.

# Médias marginais (erros padrões diferentes pelo desbalanceamento).
emm <- emmeans::emmeans(m1, specs = "sacarose")
emm

# Contrastes entre média marginais.
emmeans::contrast(emm, method = "pairwise")
À disposição.
Walmes.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Desdobramento de um fatorial triplo

2019-11-19 Thread Walmes Zeviani por (R-br)
Respostas dentro da mensagem.

À disposição.
Walmes.

On Mon, Nov 18, 2019 at 7:19 PM Maurício Lordêlo 
wrote:

> Obrigado Walmes!
> Tenho feito bastante esta análise exploratória por achar fundamental
> conhecer os dados. A questão que como dou muito suporte para trabalhos de
> mestrado e doutorado, eles cobram os testes de normalidade e homogeneidade
> de variâncias.
>

É uma cultura a ser mudada. Hábitos que de uma época com pouco recursos de
visualização e do uso precedural da estatística (faça o texte X, se
rejeitar H0, faça Y, caso contrário faça Z, etc). Também tenho contato com
público assim, mas tô sempre argumentando, redijo a leitura dos gráficos,
não reporto CV nas minhas análises (apenas quando o revisor não aceita as
justificativas dadas para omissão).


> Confesso que tenho muita dificuldade em explicar algumas funções e
> resultados do R para os pesquisadores da área de Agrárias e Biológicas.
> Muitas vezes é uma tarefa árdua pelos vícios que adquirem.
>

É uma cultura. Mudá-la leva tempo.


> Tenho feito o uso do pacote ExpDes, devido ao fato de muitos já terem
> utilizado o SisVar.
> Rodei esta transformação proposta [(m_seca_raiz + 0.1)^0.5] usando a
> função a fat3dic deste pacote.
> Aproveitando a oportunidade, como o coeficiente de variação deu bem alto
> neste caso, qual a sua sugestão para convencer estes pesquisadores que esta
> medida não é "a medida"?
> Eles "idolatram" este coeficiente...rs rs rs.
>

Primeiro ponto é argumentar que não existe vínculo entre CV alto/baixo e
não atendimento ou não dos pressupostos.
Pode-se ter CV baixo com sérios afastamentos. Pode-se ter CV alto com total
conformidade com as suposições.
As pessoas criaram a regra no sentido inverso. Por exemplo, sempre viam que
dados de contagem tem alto CV e geralmente não atendem os pressupostos. Aí
entenderam que CV alto implica em falta de pressupostos, o que não é
fundamentalmente verdade. Sempre que se usava uma transformação
estabilizadora da variância, o CV era grande, mas porque a distribuição
assumida para aplicações das funções estabilizadoras mais comuns é Poisson
(contagem) ou proporção (Binomial), que não atendem os pressupostos.
Portanto, a prática sem muita reflexão ou esclarecimento criou uma regra ao
contrário, a de que CV alto é sinal de problema.

O segundo ponto são as faixas para classificação do CV em baixo, médio e
alto. Elas são arbitrárias. Aí os pesquisadores querem comparar um CV de 8%
para produtividade de grãos em experimentos em vários locais com um CV de
38% de crescimento radicular em cultivo in vitro avaliando o efeito de
doses homeopáticas de hormônio. Não tem como comparar isso. Uma coisa é
feita em macro escala, grandes parcelas, variável resposta controlada por
muitos genes e condições ambientais. O outro é micro escala. Um é
produtividade de grãos (kg/ha) o outro é comprimento (mm de raíz). Como que
uma estatística adquiriu tamanha e desproporcional importância?

Se você pensar o que o CV está medindo, fica claro que ele não deveria ser
usado em uma análise de experimentos. É o quociente entre desvio padrão
residual e média amostral do experimento (CV 100 · DP/M). Mas se o
experimento é feito com a premissa de existência de diferença entre médias
(efeito dos tratamentos), que valor tem uma estatística que usa uma média
global? Em alguns poucos contextos haverá justificativa (i.e. efeitos
aleatórios). Outro ponto é que pressupõe uma relação 1:1 entre média e
desvio padrão, justamente se contrapondo a suposição de ausência de relação
entre média e variância.

Existem muitos pontos frágeis sobre o CV. Eu poderia prosseguir aqui por
muitas linhas. Mas eu geralmente me atenho ao primeiro: não existe relação
entre valor do CV com atendimento dos pressupostos (a menos se for
conhecida a distribuição dos dados). O CV estando alto ou não, se os
pressupostos forem atendidos, a parte inferencial está assegurada
(distribuições das estatísticas de teste conforme esperado, cobertura dos
intervalos de confiança conforme esperado, níveis de significância conforme
esperado, etc). Mas se ainda o sujeito quiser olhar pro CV alto e dizer que
o experimento foi mal conduzido (é a coisa mais comum de ouvir), o que é
lamentável, veja se consegue dialogar e desfazer a cultura aos poucos.


>
> Outro pedido é que gostaria de uma função diferente destas (do pacote
> ExpDes) para obter estes resultados do desdobramento. Você tem alguma
> sugestão cujas sintaxe e resultado
> são mais ou menos fáceis de serem entendidas por este público?
>

Não tenho opções que sejam mais fáceis que o respostado pelo ExpDes ou
SISVAR.
Tenho apenas alternativas mais gerais para casos não gaussianos,
balanceados, etc. O que posso recomendar para fazer o desdobramento no caso
no glm(), survreg() e outros modelos paramétricos ou delineamentos mais
completos é `emmeans` e `multcomp`. Veja alguns exemplos a seguir.

GLM: http://leg.ufpr.br/~walmes/analises/WAALima/caiuae/caiuae.html
Survreg: http://leg.ufpr.br/~walmes/anali

Re: [R-br] Desdobramento de um fatorial triplo

2019-11-19 Thread Cesar Rabak por (R-br)
Prez@dos,

Quero dar um pitaco nessa conversa sobre CV e *pressupostos* (que são um
eufemismo para *normalidade*):

Considerando que o importante são os resíduos, que quando são hígidos têm
média zero, pela definição de CV seria indeterminado (tendendo ao infinito)!

Por transitividade, se a média estiver no entorno de zero e os desvios
puderem oscilar ao redor de zero, mesmo para os dados "brutos" ter-se-ia a
mesma situação. . .

Apenas para ajudar pois partilho a ideia que certas práticas do passado
precisam ser banidas, mas parafraseando J. K. Galbraith "Todo o revisor
anônimo é um cara que estudou Estatística com um livro de um autor que já
morreu há muitos anos" 😉

HTH

On Tue, Nov 19, 2019 at 2:53 PM Walmes Zeviani por (R-br) <
r-br@listas.c3sl.ufpr.br> wrote:

> Respostas dentro da mensagem.
>
> À disposição.
> Walmes.
>
> On Mon, Nov 18, 2019 at 7:19 PM Maurício Lordêlo 
> wrote:
>
>> Obrigado Walmes!
>> Tenho feito bastante esta análise exploratória por achar fundamental
>> conhecer os dados. A questão que como dou muito suporte para trabalhos de
>> mestrado e doutorado, eles cobram os testes de normalidade e homogeneidade
>> de variâncias.
>>
>
> É uma cultura a ser mudada. Hábitos que de uma época com pouco recursos de
> visualização e do uso precedural da estatística (faça o texte X, se
> rejeitar H0, faça Y, caso contrário faça Z, etc). Também tenho contato com
> público assim, mas tô sempre argumentando, redijo a leitura dos gráficos,
> não reporto CV nas minhas análises (apenas quando o revisor não aceita as
> justificativas dadas para omissão).
>
>
>> Confesso que tenho muita dificuldade em explicar algumas funções e
>> resultados do R para os pesquisadores da área de Agrárias e Biológicas.
>> Muitas vezes é uma tarefa árdua pelos vícios que adquirem.
>>
>
> É uma cultura. Mudá-la leva tempo.
>
>
>> Tenho feito o uso do pacote ExpDes, devido ao fato de muitos já terem
>> utilizado o SisVar.
>> Rodei esta transformação proposta [(m_seca_raiz + 0.1)^0.5] usando a
>> função a fat3dic deste pacote.
>> Aproveitando a oportunidade, como o coeficiente de variação deu bem alto
>> neste caso, qual a sua sugestão para convencer estes pesquisadores que esta
>> medida não é "a medida"?
>> Eles "idolatram" este coeficiente...rs rs rs.
>>
>
> Primeiro ponto é argumentar que não existe vínculo entre CV alto/baixo e
> não atendimento ou não dos pressupostos.
> Pode-se ter CV baixo com sérios afastamentos. Pode-se ter CV alto com
> total conformidade com as suposições.
> As pessoas criaram a regra no sentido inverso. Por exemplo, sempre viam
> que dados de contagem tem alto CV e geralmente não atendem os pressupostos.
> Aí entenderam que CV alto implica em falta de pressupostos, o que não é
> fundamentalmente verdade. Sempre que se usava uma transformação
> estabilizadora da variância, o CV era grande, mas porque a distribuição
> assumida para aplicações das funções estabilizadoras mais comuns é Poisson
> (contagem) ou proporção (Binomial), que não atendem os pressupostos.
> Portanto, a prática sem muita reflexão ou esclarecimento criou uma regra ao
> contrário, a de que CV alto é sinal de problema.
>
> O segundo ponto são as faixas para classificação do CV em baixo, médio e
> alto. Elas são arbitrárias. Aí os pesquisadores querem comparar um CV de 8%
> para produtividade de grãos em experimentos em vários locais com um CV de
> 38% de crescimento radicular em cultivo in vitro avaliando o efeito de
> doses homeopáticas de hormônio. Não tem como comparar isso. Uma coisa é
> feita em macro escala, grandes parcelas, variável resposta controlada por
> muitos genes e condições ambientais. O outro é micro escala. Um é
> produtividade de grãos (kg/ha) o outro é comprimento (mm de raíz). Como que
> uma estatística adquiriu tamanha e desproporcional importância?
>
> Se você pensar o que o CV está medindo, fica claro que ele não deveria ser
> usado em uma análise de experimentos. É o quociente entre desvio padrão
> residual e média amostral do experimento (CV 100 · DP/M). Mas se o
> experimento é feito com a premissa de existência de diferença entre médias
> (efeito dos tratamentos), que valor tem uma estatística que usa uma média
> global? Em alguns poucos contextos haverá justificativa (i.e. efeitos
> aleatórios). Outro ponto é que pressupõe uma relação 1:1 entre média e
> desvio padrão, justamente se contrapondo a suposição de ausência de relação
> entre média e variância.
>
> Existem muitos pontos frágeis sobre o CV. Eu poderia prosseguir aqui por
> muitas linhas. Mas eu geralmente me atenho ao primeiro: não existe relação
> entre valor do CV com atendimento dos pressupostos (a menos se for
> conhecida a distribuição dos dados). O CV estando alto ou não, se os
> pressupostos forem atendidos, a parte inferencial está assegurada
> (distribuições das estatísticas de teste conforme esperado, cobertura dos
> intervalos de confiança conforme esperado, níveis de significância conforme
> esperado, etc). Mas se ain

Re: [R-br] Desdobramento de um fatorial triplo

2019-11-21 Thread Walmes Zeviani por (R-br)
Cesar,

Seus apontamentos são muito bem vindos.
Complementos na mensagem.

À disposição.
Walmes.


On Tue, Nov 19, 2019 at 9:04 PM Cesar Rabak por (R-br) <
r-br@listas.c3sl.ufpr.br> wrote:

> Prez@dos,
>
> Quero dar um pitaco nessa conversa sobre CV e *pressupostos* (que são um
> eufemismo para *normalidade*):
>

Talvez não necessariamente. Quando me refiro a análise dos pressupostos
estou considerando a abordagem gráfica da inspeção dos 4 gráficos padrões
do R para o objeto de classe lm. Lá você está avaliando os pressupostos em
propriedades que vão além da questão apenas relacionada a normalidade. Mas
entendo que para a maioria pressupostos e normalidade são praticamente a
mesma coisa.


> Considerando que o importante são os resíduos, que quando são hígidos têm
> média zero, pela definição de CV seria indeterminado (tendendo ao infinito)!
>

Exatamente! Outro ponto é que coeficiente de variação é uma medida
descritiva que introduzimos nos cursos de estatística básica quando
analisamos a distribuição de uma variável aleatória, etc. No caso de um
experimento, temos amostras de potencialmente diferentes populações
(tratamentos), então esse CV coletivo está estimando uma única média quando
podem haver várias. Na minha humilde opinião, essa maldição do CV (R²
talvez seja o mesmo caso) provavelmente surgiu do senso de dever que o
pesquisador sentia de discutir todos os números reportados pela maioria dos
softwares e quase que todos eles colocam o CV na saída acompanhando um
quadro de anova. Aí como é porcentagem, adimensional, etc, fácil de
interpretar, ficou convidativo sempre discuti-lo até o ponto de se tornar
exagerado, desproporcional e distorcido.


>
> Por transitividade, se a média estiver no entorno de zero e os desvios
> puderem oscilar ao redor de zero, mesmo para os dados "brutos" ter-se-ia a
> mesma situação. . .
>
> Apenas para ajudar pois partilho a ideia que certas práticas do passado
> precisam ser banidas, mas parafraseando J. K. Galbraith "Todo o revisor
> anônimo é um cara que estudou Estatística com um livro de um autor que já
> morreu há muitos anos" 😉
>

> HTH
>
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.