韦尔奇 t 检验：何时使用 + 示例

经过本杰明·安德森博 29 7 月, 2023 指导 0 条评论

当我们想要比较两个独立组的均值时，我们可以选择使用两种不同的检验：

学生 t 检验：此检验假设两组数据是从遵循正态分布的总体中抽样的，并且这两个总体具有相同的方差。

Welch 的 t 检验：该检验假设两组数据都是从服从正态分布的总体中采样的，但并不假设这两个总体具有相同的方差。

Student t 检验和 Welch t 检验之间的差异

Student t 检验和 Welch t 检验的执行方式有两个不同之处：

检验统计量
自由程度

学生 t 检验：

检验统计量：( x ₁ – x ₂ ) / s _p (√ 1/n ₁ + 1/n ₂ )

其中x ₁和x ₂是样本均值，n ₁和 n ₂分别是样本 1 和样本 2 的样本量，其中 s _p计算如下：

s _p = √ (n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² / (n ₁ +n ₂ -2)

其中 s ₁ ²和 s ₂ ²是样本方差。

自由度： n ₁ + n ₂ – 2

韦尔奇的 T 检验

检验统计量：( x ₁ – x ₂ ) / (√ s ₁ ² /n ₁ + s ₂ ² /n ₂ )

自由度： (s ₁ ² /n ₁ + s ₂ ² /n ₂ ) ² / { [ (s ₁ ² / n ₁ ) ² / (n ₁ – 1) ] + [ (s ₂ ² / n ₂ ) ² / (n ₂ – 1) ] }

计算韦尔奇 t 检验自由度的公式考虑了两个标准差之间的差异。如果两个样本具有相同的标准差，则 Welch t 检验的自由度将与 Student t 检验的自由度完全相同。

通常，两个样本的标准差不相同，因此 Welch t 检验的自由度往往小于 Student t 检验的自由度。

还需要注意的是，韦尔奇 t 检验中的自由度通常不是整数。如果您手动测试，最好四舍五入到最小的整数。如果您使用R等统计软件，该软件将能够提供自由度的十进制值。

什么时候应该使用韦尔奇 t 检验？

有些人认为，韦尔奇 t 检验应该是比较两个独立组均值的默认选择，因为当组间样本量和方差不相等时，它比学生 t 检验表现更好，并且当样本量不同时，它给出相同的结果是不同的。差异是相等的。

实际上，当您比较两组的均值时，每组的标准差不太可能相同。因此，最好始终使用韦尔奇的 t 检验，这样您就不必对方差齐性做出假设。

使用韦尔奇 t 检验的示例

接下来，我们将对以下两个样本进行 Welch t 检验，以确定它们的总体均值是否在 0.05 显着性水平上存在显着差异：

样品 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

样品 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

我们将说明如何以三种不同的方式执行测试：

用手
使用微软Excel
使用R统计编程语言

韦尔奇手动 T 检验

要手动执行韦尔奇 t 检验，我们首先需要找到样本均值、样本方差和样本大小：

x1 _– 19.27
x2 _– 23.69
下午₁ ² – 8:42
第₂条² – 83.23
＃ ₁ – 11
＃ ₂ – 13

然后我们可以输入这些数字来查找检验统计量：

检验统计量：( x ₁ – x ₂ ) / (√ s ₁ ² /n ₁ + s ₂ ² /n ₂ )

检验统计量：(19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538

自由度： (s ₁ ² /n ₁ + s ₂ ² /n ₂ ) ² / { [ (s ₁ ² / n ₁ ) ² / (n ₁ – 1) ] + [ (s ₂ ² / n ₂ ) ² / (n ₂ – 1) ] }

自由度：(20.42/11 + 83.23/13) ² / { [ (20.42/11) ² / (11 – 1) ] + [ (83.23/13) ² / (13 – 1) ] } = 18.137。我们将此结果四舍五入为最接近的整数18 。

最后，我们将在 t 分布表中找到临界值t ，它对应于 18 个自由度的 alpha = 0.05 的双边检验：

分布表T

临界值 t 是2.101 。由于我们的检验统计量的绝对值 (1.538) 不大于临界值 t，因此我们无法拒绝检验的原假设。没有足够的证据表明两个人群的均值存在显着差异。

使用 Excel 进行韦尔奇 T 检验

要在 Excel 中执行韦尔奇 t 检验，我们首先需要下载免费的分析工具库软件。如果您尚未在 Excel 中下载它，我编写了一个有关如何下载它的快速教程。

下载分析工具库后，您可以按照以下步骤对我们的两个样本执行 Welch t 检验：

1. 输入数据。在 A 列和 B 列中输入两个样本的数据值，并在每列的第一个单元格中输入标题“样本 1”和“样本 2” 。

2. 使用分析工具库执行 Welch t 检验。转到顶部功能区的“数据”选项卡。接下来，在“分析”组下，单击“分析工具库”图标。

在出现的对话框中，单击“t 检验：假设方差不等的两个样本” ，然后单击“确定”。

最后，填写下面的值然后单击“确定”：

应出现以下结果：

请注意，此测试的结果与我们手动获得的结果相对应：

检验统计量为-1.5379 。
两侧临界值为2.1009 。
由于检验统计量的绝对值不大于双尾临界值，因此两个总体的均值没有统计差异。
此外，检验的双尾 p 值为 0.14，大于 0.05，证实两个总体的均值没有统计差异。

使用 R 进行韦尔奇 t 检验

以下代码说明了如何使用R统计编程语言对两个样本执行 Welch t 检验：

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

t.test()函数显示以下相关输出：

t：检验统计量 = -1.5379
df ：自由度 = 18.137
p 值：双尾检验的 p 值 = 0.1413
95% 置信区间：总体平均值的真实差异的 95%置信区间= (-10.45, 1.61)

该检验的结果与手动和使用 Excel 获得的结果相对应：这两个总体的平均值差异在 alpha = 0.05 的水平上并不具有统计显着性。

关于作者

本杰明·安德森博

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多