Guia completo: como interpretar resultados de anova em r
Uma ANOVA unidirecional é usada para determinar se há ou não uma diferença estatisticamente significativa entre as médias de três ou mais grupos independentes.
Este tutorial fornece um guia completo sobre como interpretar os resultados de uma ANOVA unidirecional em R.
Etapa 1: crie os dados
Suponha que queiramos determinar se três programas de treinamento diferentes resultam em perdas médias de peso diferentes nos indivíduos.
Para testar isso, recrutamos 90 pessoas para participar de um experimento no qual designamos aleatoriamente 30 pessoas para seguir o Programa A, o Programa B ou o Programa C durante um mês.
O código a seguir cria o quadro de dados com o qual trabalharemos:
#make this example reproducible
set. seeds (0)
#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
weight_loss = c(runif(30, 0, 3),
runif(30, 0, 5),
runif(30, 1, 7)))
#view first six rows of data frame
head(data)
program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458
Etapa 2: execute a ANOVA
A seguir, usaremos o comando aov() para realizar uma ANOVA unidirecional:
#fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)
Etapa 3: interpretar os resultados da ANOVA
A seguir, usaremos o comando summary() para exibir os resultados da ANOVA unidirecional:
#view summary of one-way ANOVA model
summary(model)
Df Sum Sq Mean Sq F value Pr(>F)
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Veja como interpretar cada valor de resultado:
Programa Df: Os graus de liberdade da variável programa . Isso é calculado como #groups -1. Neste caso foram 3 programas de treinamento diferentes, então esse valor é: 3-1 = 2 .
Resíduos Df: Os graus de liberdade para os resíduos. Isso é calculado como #total de observações – #grupos. Neste caso, foram 90 observações e 3 grupos, então esse valor é: 90 -3 = 87 .
Program Sum Sq: A soma dos quadrados associados à variável program . Este valor é 98,93 .
Soma dos resíduos quadrados: soma dos quadrados associados aos resíduos ou “erros”. Este valor é 139,57 .
Quadrado médio. Programa: A soma média dos quadrados associados ao programa. Isso é calculado como a soma quadrada. programa / programa Df. Neste caso, isso é calculado como: 98,93 / 2 = 49,46 .
Quadrado médio. Resíduos: soma média dos quadrados associados aos resíduos. Isso é calculado como a soma quadrada. resíduos/resíduos Df. Neste caso, isso é calculado da seguinte forma: 139,57 / 87 = 1,60 .
Valor F: A estatística F geral do modelo ANOVA. Isso é calculado como o quadrado médio. programa / quadrado médio. Resíduos. Neste caso, é calculado da seguinte forma: 49,46 / 1,60 = 30,83 .
Pr(>F): O valor p associado à estatística F com numerador df = 2 e denominador df = 87. Nesse caso, o valor p é 7.552e-11 , que é um número extremamente pequeno.
O valor mais importante no conjunto de resultados é o valor p, pois nos diz se há diferença significativa nos valores médios entre os três grupos.
Lembre-se de que uma ANOVA unidirecional usa as seguintes hipóteses nulas e alternativas:
- H 0 (hipótese nula): todas as médias do grupo são iguais.
- H A (hipótese alternativa): Pelo menos a média de um grupo é diferente das demais.
Como o valor p em nossa tabela ANOVA (0,7552e-11) é inferior a 0,05, temos evidências suficientes para rejeitar a hipótese nula.
Isto significa que temos provas suficientes para afirmar que a perda média de peso experimentada pelos indivíduos não é igual entre os três programas de treino.
Etapa 4: realizar testes post-hoc (se necessário)
Se o valor p na saída da ANOVA for inferior a 0,05, rejeitamos a hipótese nula. Isso nos diz que o valor médio entre cada grupo não é igual. No entanto, isso não nos diz quais grupos diferem uns dos outros.
Para descobrir, precisamos realizar um teste post hoc . Em R, podemos usar a função TukeyHSD() para fazer isso:
#perform Tukey post-hoc test
TukeyHSD(model)
$program
diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199
Veja como interpretar os resultados:
- O valor p ajustado para a diferença média entre os grupos A e B é 0,0100545 .
- O valor p ajustado para a diferença média entre os grupos A e C é 0,0000000 .
- O valor p ajustado para a diferença média entre os grupos B e C é 0,0000199 .
Como cada um dos valores de p ajustados é inferior a 0,05, podemos concluir que existe uma diferença significativa na perda média de peso entre cada grupo.
Recursos adicionais
Introdução à ANOVA unidirecional
Como verificar as suposições da ANOVA
Como realizar manualmente uma ANOVA unidirecional
Calculadora ANOVA unidirecional