如何计算方差分析中的平方和(举例)
在统计学中,单向方差分析用于比较三个或更多独立组的均值,以确定相应总体的均值之间是否存在统计上显着的差异。
每当执行单向方差分析时,您始终会计算三个平方和值:
1. 平方和回归(SSR)
- 它是各组平均数与总平均数之差的平方和。
2. 误差平方和(SSE)
- 这是每个单独观察值与该观察值的组均值之间差异的平方和。
3.总平方和(SST)
- 这是每个单独观察值与总体平均值之间差异的平方和。
这三个值中的每一个都被放置在最终的方差分析表中,我们用它来确定组均值之间是否存在统计上的显着差异。
以下示例展示了如何在实践中计算单向方差分析的每个平方和值。
示例:如何计算方差分析中的平方和
假设我们想知道三种不同的考试准备计划是否会导致给定考试的平均分数不同。为了测试这一点,我们招募了 30 名学生参加一项研究,并将他们分为三组。
每组的学生被随机分配在接下来的三周内使用三个考试准备计划之一来准备考试。三周结束时,所有学生都参加相同的考试。
各组考试成绩如下:
以下步骤展示了如何计算此单向方差分析的平方和值。
步骤1:计算组平均数和总平均数。
首先,我们将计算三组的平均值以及总体(或“总体”)平均值:
步骤2:计算SSR。
接下来,我们将使用以下公式计算平方和回归(SSR):
nΣ(X j – X ..) 2
金子:
- n : 第 j 组的样本量
- Σ :希腊符号,意思是“和”
- X j : 第 j 组的平均值
- X .. : 总体平均值
在我们的示例中,我们计算出 SSR = 10(83.4-85.8) 2 + 10(89.3-85.8) 2 + 10(84.7-85.8) 2 = 192.2
步骤 3:计算 SES。
接下来,我们将使用以下公式计算平方和误差 (SSE):
Σ(X ij – X j ) 2
金子:
- Σ :希腊符号,意思是“和”
- X ij : j 组的第 i 个观察值
- X j : 第 j 组的平均值
在我们的示例中,我们计算 SSE 如下:
第 1 组: (85-83.4) 2 + (86-83.4) 2 + (88-83.4) 2 + (75-83.4) 2 + (78-83.4) 2 + (94-83.4) 2 + (98-83.4) 2 + (79-83.4) 2 + (71-83.4) 2 + (80-83.4) 2 = 640.4
第 2 组: (91-89.3) 2 + (92-89.3) 2 + (93-89.3) 2 + (85-89.3) 2 + (87-89.3) 2 + (84-89.3) 2 + (82-89.3) 2 + (88-89.3) 2 + (95-89.3) 2 + (96-89.3) 2 = 208.1
第 3 组: (79-84.7) 2 + (78-84.7) 2 + (88-84.7) 2 + (94-84.7) 2 + (92-84.7) 2 + (85-84.7) 2 + (83-84.7) 2 + (85-84.7) 2 + (82-84.7) 2 + (81-84.7) 2 = 252.1
ESS: 640.4 + 208.1 + 252.1 = 1,100.6
步骤 4:计算 SST。
接下来,我们将使用以下公式计算总平方和 (SST):
SST = SSR + SSE
在我们的示例中,海温 = 192.2 + 1100.6 = 1292.8
一旦我们计算出SSR、SSE和SST的值,这些值中的每一个最终都会被放入ANOVA表中:
来源 | 平方和 (SS) | df | 均方 (MS) | F值 | p 值 |
---|---|---|---|---|---|
回归 | 192.2 | 2 | 96.1 | 2,358 | 0.1138 |
错误 | 1100.6 | 27 | 40.8 | ||
全部的 | 1292.8 | 29 |
以下是我们计算表中不同数字的方法:
- 回归 df: k-1 = 3-1 = 2
- 误差df: nk=30-3=27
- 总 df: n-1 = 30-1 = 29
- SEP处理: SST处理/df = 192.2 / 2 = 96.1
- MS误差: SSE误差/df=1100.6/27=40.8
- F值: MS处理/MS误差=96.1/40.8=2.358
- p-value :对应于 F 值的 p-值。
注: n = 观察总数,k = 组数
查看本教程,了解如何解释方差分析表中的 F 值和 p 值。