如何手动执行单向方差分析
单向方差分析(“方差分析”)比较三个或更多独立组的均值,以确定相应总体的均值之间是否存在统计显着差异。
本教程介绍如何手动执行单向方差分析。
示例:手动单向方差分析
假设我们想知道三种不同的考试准备计划是否会导致给定考试的平均分数不同。为了测试这一点,我们招募了 30 名学生参加一项研究,并将他们分为三组。
每组的学生被随机分配在接下来的三周内使用三个考试准备计划之一来准备考试。三周结束时,所有学生都参加相同的考试。
各组考试成绩如下:
按照以下步骤手动执行单向方差分析,以确定三组之间的平均考试成绩是否不同:
步骤1:计算组平均数和总平均数。
首先,我们计算三组的平均值以及总体平均值:
步骤2:计算SSR。
接下来,我们将使用以下公式计算平方和回归(SSR):
nΣ(X j – X ..) 2
金子:
- n : 第 j 组的样本量
- Σ :希腊符号,意思是“和”
- X j : 第 j 组的平均值
- X .. : 总体平均值
在我们的示例中,我们计算出 SSR = 10(83.4-85.8) 2 + 10(89.3-85.8) 2 + 10(84.7-85.8) 2 = 192.2
步骤 3:计算 SES。
接下来,我们将使用以下公式计算平方误差和 (SSE):
Σ(X ij – X j ) 2
金子:
- Σ :希腊符号,意思是“和”
- X ij : j 组的第 i 个观察值
- X j : 第 j 组的平均值
在我们的示例中,我们计算 SSE 如下:
第 1 组: (85-83.4) 2 + (86-83.4) 2 + (88-83.4) 2 + (75-83.4) 2 + (78-83.4) 2 + (94-83.4) 2 + (98-83.4) 2 + (79-83.4) 2 + (71-83.4) 2 + (80-83.4) 2 = 640.4
第 2 组: (91-89.3) 2 + (92-89.3) 2 + (93-89.3) 2 + (85-89.3) 2 + (87-89.3) 2 + (84-89.3) 2 + (82-89.3) 2 + (88-89.3) 2 + (95-89.3) 2 + (96-89.3) 2 = 208.1
第 3 组: (79-84.7) 2 + (78-84.7) 2 + (88-84.7) 2 + (94-84.7) 2 + (92-84.7) 2 + (85-84.7) 2 + (83-84.7) 2 + (85-84.7) 2 + (82-84.7) 2 + (81-84.7) 2 = 252.1
ESS: 640.4 + 208.1 + 252.1 = 1,100.6
步骤 4:计算 SST。
接下来,我们将使用以下公式计算总平方和 (SST):
SST = SSR + SSE
在我们的示例中,海温 = 192.2 + 1100.6 = 1292.8
第 5 步:完成方差分析表。
现在我们有了 SSR、SSE 和 SST,我们可以填充 ANOVA 表:
来源 | 平方和 (SS) | df | 均方 (MS) | F |
---|---|---|---|---|
治疗 | 192.2 | 2 | 96.1 | 2,358 |
错误 | 1100.6 | 27 | 40.8 | |
全部的 | 1292.8 | 29 |
以下是我们计算表中不同数字的方法:
- 处理df: k-1=3-1=2
- 误差df: nk=30-3=27
- 总 df: n-1 = 30-1 = 29
- SEP处理: SST处理/df=192.2/2=96.1
- MS误差: SSE误差/df=1100.6/27=40.8
- F: MS 处理 / MS 误差 = 96.1 / 40.8 = 2.358
注: n = 观察总数,k = 组数
第 6 步:解释结果。
此单向方差分析的 F 检验统计量为2.358 。为了确定这是否是一个具有统计显着性的结果,我们需要将其与F 分布表中的临界 F 值进行比较,其值如下:
- α(显着性水平)= 0.05
- DF1(分子自由度)= df 处理 = 2
- DF2(分母自由度)=误差df=27
我们发现 F 的临界值为3.3541 。
由于方差分析表中的 F 检验统计量小于 F 分布表中的临界值 F,因此我们无法拒绝原假设。这意味着我们没有足够的证据表明三组的平均考试成绩之间存在统计上的显着差异。
额外资源:使用此单向方差分析计算器可自动对最多五个样本执行单向方差分析。