如何在 stata 中进行 welch t 检验
比较两个独立组之间均值的最常见方法是使用双样本 t 检验。然而,该检验假设两组之间的方差相等。
如果您认为两组之间的方差不相等,则可以使用Welch t 检验,它是双样本 t 检验的非参数等效项。
本教程介绍如何在 Stata 中执行 Welch t 检验。
示例:Stata 中的 Welch t 检验
在此示例中,我们将使用Fuel3数据集,其中包含接受某种燃料处理的 12 辆汽车和未接受某种燃料处理的 12 辆汽车的 mpg。
按照以下步骤执行 Welch’t T 检验,以确定两组之间的平均 mpg 是否存在差异。
步骤1:加载并显示数据。
首先,通过在命令框中键入以下命令来加载数据集:
使用https://www.stata-press.com/data/r13/fuel3
使用以下命令查看原始数据:
列表
第 2 步:可视化数据。
在执行 Welch 的 t 检验之前,我们首先创建两个箱线图来可视化每组的 mpg 分布:
mpg 图形框,结束(已处理)
我们可以看到,第 1 组(接受燃油处理的组)的 mpg 往往高于第 0 组。我们还可以看到,第 1 组的方差似乎比第 0 组(宽度盒子较小)。
步骤 3:执行韦尔奇 t 检验
使用以下语法执行 Welch t 检验:
ttest 变量测量,作者:(grouping_variable) welch
以下是我们特定示例的语法:
ttest mpg,由(已处理)韦尔奇
以下是如何解释结果:
- 第 0 组的平均英里数为21 英里。真实总体平均值的 95% 置信区间为(19.26525, 22.73745) 。
- 第 1 组的平均 mpg 为22.75 mpg。真实总体平均值的 95% 置信区间为(20.68449, 24.81551) 。
- 第 0 组与第 1 组的平均英里数差异为-1.75 。总体平均值之间的真实差异的 95% 置信区间为(-4.28369, 0.7836902) 。
- Welch t 检验的检验统计量t为-1.4280 。
- 因为我们对另一种假设感兴趣,即两组之间的平均 mpg 完全不同,所以我们将查看与 Ha:diff != 0 相关的 p 值,结果为0.1666 。由于该值不小于 0.05,因此我们没有足够的证据表明两组之间的平均 mpg 不同。
第四步:报告结果。
最后,我们想报告韦尔奇 t 检验的结果。以下是如何执行此操作的示例:
进行韦尔奇 t 检验以确定接受燃油处理的一组汽车和未进行燃油处理的一组汽车之间的英里/加仑数是否存在统计学上的显着差异。两组的样本量均为 12 辆汽车。
Welch 的 t 检验显示,两组之间的平均值(t = -1.4280,p = 0.1666)没有统计学上的显着差异。
第 0 组(非治疗组)和第 1 组(治疗组)之间真实平均差异的 95% 置信区间为 (-4.28369, 0.7836902)。