完整指南:如何解释 r 中的方差分析结果
单向方差分析用于确定三个或更多独立组的平均值之间是否存在统计显着差异。
本教程提供了有关如何解释 R 中单向方差分析结果的完整指南。
第 1 步:创建数据
假设我们想要确定三种不同的训练计划是否会导致个体的平均体重减轻不同。
为了测试这一点,我们招募了 90 人参加一项实验,其中我们随机分配 30 人遵循计划 A、计划 B 或计划 C 一个月。
以下代码创建我们将使用的数据框:
#make this example reproducible
set. seeds (0)
#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
weight_loss = c(runif(30, 0, 3),
runif(30, 0, 5),
runif(30, 1, 7)))
#view first six rows of data frame
head(data)
program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458
第 2 步:执行方差分析
接下来,我们将使用aov()命令执行单向方差分析:
#fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)
第 3 步:解释方差分析结果
接下来,我们将使用summary()命令来显示单向方差分析结果:
#view summary of one-way ANOVA model
summary(model)
Df Sum Sq Mean Sq F value Pr(>F)
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
以下是如何解释每个结果值:
程序Df:可变程序的自由度。其计算方式为#groups -1。在本例中,有 3 个不同的训练计划,因此该值为: 3-1 = 2 。
Df Residuals:残差的自由度。计算方式为#total Observations – #groups。在本例中,有 90 个观测值和 3 个组,因此该值为:90 -3 = 87 。
程序和平方:与变量程序关联的平方和。该值为98.93 。
残差平方和:与残差或“误差”相关的平方和。该值为139.57 。
中方形。程序:与程序相关的平均平方和。这是按平方和计算的。程序/程序Df。在本例中,计算公式为: 98.93 / 2 = 49.46 。
中方形。残差:与残差相关的平均平方和。这是按平方和计算的。残基/残基Df。在这种情况下,计算如下: 139.57 / 87 = 1.60 。
F值: ANOVA模型的总体F统计量。这被计算为均方。程序/均方。残留物。在这种情况下,计算如下: 49.46 / 1.60 = 30.83 。
Pr(>F):与分子 df = 2 且分母 df = 87 的 F 统计量相关的 p 值。在本例中,p 值为7.552e-11 ,这是一个极小的数字。
这组结果中最重要的值是 p 值,因为它告诉我们三组之间的平均值是否存在显着差异。
回想一下,单向方差分析使用以下原假设和备择假设:
- H 0 (零假设):所有组均值相等。
- H A (替代假设):至少有一组平均值与其他组不同。
由于方差分析表 (.7552e-11) 中的 p 值小于 0.05,因此我们有足够的证据来拒绝原假设。
这意味着我们有足够的证据表明,三个训练计划之间个人经历的平均体重减轻并不相等。
第 4 步:执行事后测试(如有必要)
如果方差分析输出中的 p 值小于 0.05,我们拒绝原假设。这告诉我们每组之间的平均值不相等。然而,这并没有告诉我们哪些群体彼此不同。
为了找到答案,我们需要进行事后测试。在 R 中,我们可以使用TukeyHSD()函数来执行此操作:
#perform Tukey post-hoc test
TukeyHSD(model)
$program
diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199
以下是如何解释结果:
- A 组和 B 组之间的平均差的调整 p 值为0.0100545 。
- A 组和 C 组之间的平均差的调整 p 值为0.0000000 。
- B 组和 C 组之间的平均差的调整 p 值为0.0000199 。
由于每个调整后的 p 值都小于 0.05,因此我们可以得出结论,每组之间的平均体重减轻存在显着差异。