韦尔奇 t 检验:何时使用 + 示例


当我们想要比较两个独立组的均值时,我们可以选择使用两种不同的检验:

学生 t 检验:此检验假设两组数据是从遵循正态分布的总体中抽样的,并且这两个总体具有相同的方差。

Welch 的 t 检验:该检验假设两组数据都是从服从正态分布的总体中采样的,但并不假设这两个总体具有相同的方差

Student t 检验和 Welch t 检验之间的差异

Student t 检验和 Welch t 检验的执行方式有两个不同之处:

  • 检验统计量
  • 自由程度

学生 t 检验:

检验统计量:( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

其中x 1x 2是样本均值,n 1和 n 2分别是样本 1 和样本 2 的样本量,其中 s p计算如下:

s p = (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

其中 s 1 2和 s 2 2是样本方差。

自由度: n 1 + n 2 – 2

韦尔奇的 T 检验

检验统计量:( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

自由度: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

计算韦尔奇 t 检验自由度的公式考虑了两个标准差之间的差异。如果两个样本具有相同的标准差,则 Welch t 检验的自由度将与 Student t 检验的自由度完全相同。

通常,两个样本的标准差不相同,因此 Welch t 检验的自由度往往小于 Student t 检验的自由度。

还需要注意的是,韦尔奇 t 检验中的自由度通常不是整数。如果您手动测试,最好四舍五入到最小的整数。如果您使用R等统计软件,该软件将能够提供自由度的十进制值。

什么时候应该使用韦尔奇 t 检验?

有些人认为, 韦尔奇 t 检验应该是比较两个独立组均值的默认选择,因为当组间样本量和方差不相等时,它比学生 t 检验表现更好,并且当样本量不同时,它给出相同的结果是不同的。差异是相等的。

实际上,当您比较两组的均值时,每组的标准差不太可能相同。因此,最好始终使用韦尔奇的 t 检验,这样您就不必对方差齐性做出假设。

使用韦尔奇 t 检验的示例

接下来,我们将对以下两个样本进行 Welch t 检验,以确定它们的总体均值是否在 0.05 显着性水平上存在显着差异:

样品 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

样品 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

我们将说明如何以三种不同的方式执行测试:

  • 用手
  • 使用微软Excel
  • 使用R统计编程语言

韦尔奇手动 T 检验

要手动执行韦尔奇 t 检验,我们首先需要找到样本均值、样本方差和样本大小:

x1 19.27
x2 23.69
下午1 2 – 8:42
22 – 83.23
1 – 11
2 – 13

然后我们可以输入这些数字来查找检验统计量:

检验统计量:( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

检验统计量:(19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538

自由度: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

自由度:(20.42/11 + 83.23/13) 2 / { [ (20.42/11) 2 / (11 – 1) ] + [ (83.23/13) 2 / (13 – 1) ] } = 18.137。我们将此结果四舍五入为最接近的整数18

最后,我们将在 t 分布表中找到临界值t ,它对应于 18 个自由度的 alpha = 0.05 的双边检验:

分布表T

临界值 t 是2.101 。由于我们的检验统计量的绝对值 (1.538) 不大于临界值 t,因此我们无法拒绝检验的原假设。没有足够的证据表明两个人群的均值存在显着差异。

使用 Excel 进行韦尔奇 T 检验

要在 Excel 中执行韦尔奇 t 检验,我们首先需要下载免费的分析工具库软件。如果您尚未在 Excel 中下载它,我编写了一个有关如何下载它的快速教程

下载分析工具库后,您可以按照以下步骤对我们的两个样本执行 Welch t 检验:

1. 输入数据。在 A 列和 B 列中输入两个样本的数据值,并在每列的第一个单元格中输入标题“样本 1”“样本 2”

2. 使用分析工具库执行 Welch t 检验。转到顶部功能区的“数据”选项卡。接下来,在“分析”组下,单击“分析工具库”图标。

在出现的对话框中,单击“t 检验:假设方差不等的两个样本” ,然后单击“确定”。

最后,填写下面的值然后单击“确定”:

应出现以下结果:

请注意,此测试的结果与我们手动获得的结果相对应:

  • 检验统计量为-1.5379
  • 两侧临界值为2.1009
  • 由于检验统计量的绝对值不大于双尾临界值,因此两个总体的均值没有统计差异。
  • 此外,检验的双尾 p 值为 0.14,大于 0.05,证实两个总体的均值没有统计差异。

使用 R 进行韦尔奇 t 检验

以下代码说明了如何使用R统计编程语言对两个样本执行 Welch t 检验:

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

t.test()函数显示以下相关输出:

  • t:检验统计量 = -1.5379
  • df :自由度 = 18.137
  • p 值:双尾检验的 p 值 = 0.1413
  • 95% 置信区间:总体平均值的真实差异的 95%置信区间= (-10.45, 1.61)

该检验的结果与手动和使用 Excel 获得的结果相对应:这两个总体的平均值差异在 alpha = 0.05 的水平上并不具有统计显着性。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注