韦尔奇 t 检验:何时使用 + 示例
当我们想要比较两个独立组的均值时,我们可以选择使用两种不同的检验:
学生 t 检验:此检验假设两组数据是从遵循正态分布的总体中抽样的,并且这两个总体具有相同的方差。
Welch 的 t 检验:该检验假设两组数据都是从服从正态分布的总体中采样的,但并不假设这两个总体具有相同的方差。
Student t 检验和 Welch t 检验之间的差异
Student t 检验和 Welch t 检验的执行方式有两个不同之处:
- 检验统计量
- 自由程度
学生 t 检验:
检验统计量:( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
其中x 1和x 2是样本均值,n 1和 n 2分别是样本 1 和样本 2 的样本量,其中 s p计算如下:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
其中 s 1 2和 s 2 2是样本方差。
自由度: n 1 + n 2 – 2
韦尔奇的 T 检验
检验统计量:( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
自由度: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
计算韦尔奇 t 检验自由度的公式考虑了两个标准差之间的差异。如果两个样本具有相同的标准差,则 Welch t 检验的自由度将与 Student t 检验的自由度完全相同。
通常,两个样本的标准差不相同,因此 Welch t 检验的自由度往往小于 Student t 检验的自由度。
还需要注意的是,韦尔奇 t 检验中的自由度通常不是整数。如果您手动测试,最好四舍五入到最小的整数。如果您使用R等统计软件,该软件将能够提供自由度的十进制值。
什么时候应该使用韦尔奇 t 检验?
有些人认为, 韦尔奇 t 检验应该是比较两个独立组均值的默认选择,因为当组间样本量和方差不相等时,它比学生 t 检验表现更好,并且当样本量不同时,它给出相同的结果是不同的。差异是相等的。
实际上,当您比较两组的均值时,每组的标准差不太可能相同。因此,最好始终使用韦尔奇的 t 检验,这样您就不必对方差齐性做出假设。
使用韦尔奇 t 检验的示例
接下来,我们将对以下两个样本进行 Welch t 检验,以确定它们的总体均值是否在 0.05 显着性水平上存在显着差异:
样品 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
样品 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
我们将说明如何以三种不同的方式执行测试:
- 用手
- 使用微软Excel
- 使用R统计编程语言
韦尔奇手动 T 检验
要手动执行韦尔奇 t 检验,我们首先需要找到样本均值、样本方差和样本大小:
x1 – 19.27
x2 – 23.69
下午1 2 – 8:42
第2条2 – 83.23
# 1 – 11
# 2 – 13
然后我们可以输入这些数字来查找检验统计量:
检验统计量:( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
检验统计量:(19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538
自由度: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
自由度:(20.42/11 + 83.23/13) 2 / { [ (20.42/11) 2 / (11 – 1) ] + [ (83.23/13) 2 / (13 – 1) ] } = 18.137。我们将此结果四舍五入为最接近的整数18 。
最后,我们将在 t 分布表中找到临界值t ,它对应于 18 个自由度的 alpha = 0.05 的双边检验:
临界值 t 是2.101 。由于我们的检验统计量的绝对值 (1.538) 不大于临界值 t,因此我们无法拒绝检验的原假设。没有足够的证据表明两个人群的均值存在显着差异。
使用 Excel 进行韦尔奇 T 检验
要在 Excel 中执行韦尔奇 t 检验,我们首先需要下载免费的分析工具库软件。如果您尚未在 Excel 中下载它,我编写了一个有关如何下载它的快速教程。
下载分析工具库后,您可以按照以下步骤对我们的两个样本执行 Welch t 检验:
1. 输入数据。在 A 列和 B 列中输入两个样本的数据值,并在每列的第一个单元格中输入标题“样本 1”和“样本 2” 。
2. 使用分析工具库执行 Welch t 检验。转到顶部功能区的“数据”选项卡。接下来,在“分析”组下,单击“分析工具库”图标。
在出现的对话框中,单击“t 检验:假设方差不等的两个样本” ,然后单击“确定”。
最后,填写下面的值然后单击“确定”:
应出现以下结果:
请注意,此测试的结果与我们手动获得的结果相对应:
- 检验统计量为-1.5379 。
- 两侧临界值为2.1009 。
- 由于检验统计量的绝对值不大于双尾临界值,因此两个总体的均值没有统计差异。
- 此外,检验的双尾 p 值为 0.14,大于 0.05,证实两个总体的均值没有统计差异。
使用 R 进行韦尔奇 t 检验
以下代码说明了如何使用R统计编程语言对两个样本执行 Welch t 检验:
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
t.test()函数显示以下相关输出:
- t:检验统计量 = -1.5379
- df :自由度 = 18.137
- p 值:双尾检验的 p 值 = 0.1413
- 95% 置信区间:总体平均值的真实差异的 95%置信区间= (-10.45, 1.61)
该检验的结果与手动和使用 Excel 获得的结果相对应:这两个总体的平均值差异在 alpha = 0.05 的水平上并不具有统计显着性。