T 检验和方差分析有什么区别?
本教程解释了t 检验和方差分析之间的区别,以及何时使用每种检验。
T检验
t 检验用于确定两组平均值之间是否存在统计显着性差异。 t 检验有两种类型:
1.独立样本t检验。当我们想要比较两组均值之间的差异并且各组彼此完全独立时,可以使用此方法。
例如,研究人员可能想知道饮食 A 或饮食 B 是否有助于人们减轻更多体重。 100 名随机分配的人被分配到饮食 A。另外 100 名随机分配的人被分配到饮食 B。三个月后,研究人员记录每个人的总体重减轻情况。为了确定两组之间的平均体重减轻是否存在显着差异,研究人员可以进行独立样本t检验。
2.配对样本t检验。当我们想要比较两组平均值之间的差异以及一组中的每个观察值可以与另一组中的观察值相关联时,可以使用此方法。
例如,假设一个班有 20 名学生参加考试,然后学习某个指南,然后再次参加考试。为了比较第一次和第二次测试分数之间的差异,我们使用配对 t 检验,因为对于每个学生,他们的第一次测试分数可以与他们的第二次测试分数相关联。
为了使 t 检验产生有效结果,必须满足以下假设:
- 随机:应使用随机样本或随机实验来收集两个样本的数据。
- 正态:抽样分布呈正态或近似正态。
如果满足这些假设,则可以使用 t 检验来检验两组均值之间的差异。
方差分析
ANOVA (方差分析)用于确定三个或更多组的平均值之间是否存在统计显着差异。实践中最常用的方差分析是单向方差分析和双向方差分析:
单向方差分析:当可以在单个因素上拆分组时,用于测试三个或多个组的平均值之间是否存在统计显着性差异。
示例:您将一个由 90 名学生组成的班级随机分为三组,每组 30 人。每组使用不同的学习技巧一个月来准备考试。月底,所有学生参加相同的考试。您想知道学习技巧是否会影响考试成绩。因此,您执行单向方差分析来确定三组的平均分数之间是否存在统计显着差异。
双向方差分析:当组可以根据两个因素进行拆分时,用于测试三个或更多组的平均值之间是否存在统计显着差异。
示例:您想要确定运动水平(无运动、轻度运动、剧烈运动)和性别(男性、女性)是否会影响减肥。在这种情况下,您正在研究的两个因素是运动和性别,您的响应变量是体重减轻(以磅为单位)。您可以执行双向方差分析来确定运动和性别是否影响减肥,并确定运动和性别对减肥是否存在交互作用。
为了使方差分析产生有效的结果,必须满足以下假设:
- 正态性——我们研究的所有人群都遵循正态分布。因此,举例来说,如果我们要比较三组不同学生的考试成绩,那么第一组、第二组和第三组的考试成绩都应该服从正态分布。
- 方差相等——每组中的总体方差相等或近似相等。
- 独立性——每个组的观察结果必须相互独立。通常随机设计可以解决这个问题。
如果满足这些假设,则可以使用方差分析来检验三个或更多组的平均值之间的差异。
了解每个测试之间的差异
t 检验和方差分析之间的主要区别在于这两种检验如何计算检验统计量以确定组之间是否存在统计显着差异。
独立样本 t 检验使用以下检验统计量:
检验统计量t = [ ( x 1 – x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )
其中x 1和x 2是组 1 和 2 的样本均值, d是两个均值之间的假设差异(通常为零),s 1 2和 s 2 2是组 1 和 2 的样本方差,并且n 1和n 2分别是组1 和组2 的样本量。
配对样本 t 检验使用以下检验统计量:
检验统计量t = d / (s d / √n)
其中d是两组之间的平均差,s d是差值的标准差,n 是每组的样本量(请注意,两组的样本量相同)。
方差分析使用以下检验统计量:
检验统计量F = s 2 b / s 2 w
其中s 2 b是样本间方差,s 2 w是样本内方差。
t 检验衡量两组之间的平均差异与差异的总体标准差的比率。如果这个比率足够高,就足以证明两组之间存在显着差异。
另一方面,方差分析衡量组间方差与组内方差的比率。与 t 检验一样,如果该比率足够高,则可以提供足够的证据证明三组的均值不同。
t 检验和方差分析之间的另一个主要区别是 t 检验可以告诉我们两个组是否具有相同的均值。另一方面,方差分析告诉我们三个组是否都具有相同的均值,但它并没有明确告诉我们哪些组彼此具有不同的均值。
为了找出哪些组之间存在差异,需要进行事后测试。
了解何时使用每个测试
在实践中,当我们想要比较两组的均值时,我们使用 t 检验。当我们想要比较三个或更多组的平均值时,我们使用方差分析。
我们不简单地使用多个 t 检验来比较三个或更多组的平均值的根本原因可以追溯到理解 I 类错误率。假设我们想要比较三个组的均值:A 组、B 组和 C 组。您可能会想要执行以下三个 t 检验:
- t 检验比较 A 组和 B 组之间的均值差异
- t 检验比较 A 组和 C 组之间的均值差异
- t 检验比较 B 组和 C 组之间的均值差异
对于每个 t 检验,我们都有可能犯第一类错误,即当原假设为真时我们拒绝原假设的概率。这个概率一般是5%。这意味着当我们执行多次 t 检验时,错误率会增加。例如:
- 我们在一次 t 检验中犯 I 类错误的概率是 1 – 0.95 = 0.05 。
- 我们通过两次 t 检验出现类型 I 错误的概率为 1 – (0.95 2 ) = 0.0975 。
- 我们通过两次 t 检验出现类型 I 错误的概率为 1 – (0.95 3 ) = 0.1427 。
这个错误率高得令人无法接受。幸运的是,方差分析控制了这些错误,使 I 类错误保持在仅 5%。这使我们更加确信统计上显着的测试结果实际上是有意义的,而不仅仅是我们通过运行大量测试获得的结果。
因此,当我们想要了解三个或更多组的平均值之间是否存在差异时,我们需要使用方差分析,以便我们的结果在统计上有效且可靠。