T 检验的最小样本量:解释和示例


学生提出的一个常见问题是:

执行 t 检验是否需要最小样本量?

简短的回答:

不需要。执行 t 检验没有最小样本量要求。

事实上,第一次使用的t检验只使用了四个人的样本

但是,如果不满足 t 检验的假设,则结果可能不可靠。

此外,如果样本量太小,检验的功效可能太低,无法检测数据中的显着差异。

让我们更详细地看看这些潜在问题。

了解 t 检验假设

单样本 t 检验用于测试总体平均值是否等于某个值。

该测试做出以下假设:

  • 独立性:样本观察必须是独立的。
  • 随机抽样:应使用随机抽样方法收集观察结果,以最大限度地提高样本代表感兴趣总体的机会。
  • 正态性:观察值应近似正态分布。

双样本 t 检验用于检查两个总体的平均值之间是否存在显着差异。

该测试做出以下假设:

  • 独立性:每个样本的观察结果必须是独立的。
  • 随机抽样:应使用随机抽样方法收集每个样本的观察结果。
  • 正态性:每个样本应近似正态分布。
  • 方差相等:每个样本应具有大致相同的方差。

在执行每种类型的 t 检验时,如果不满足这些假设中的一个或多个,则检验结果可能会变得不可靠。

在这种情况下,最好使用不做出这些假设的替代非参数检验。

单样本 t 检验的非参数替代方法是Wilcoxon 符号秩检验

两样本 t 检验的非参数替代方法是曼-惠特尼 U 检验

了解 t 检验的威力

统计功效是指测试检测到实际存在的效果的概率。

可以看出,使用的样本量越小,给定测试的统计功效就越低。这就是为什么研究人员通常需要更大的样本量,以获得更高的功效,从而更有可能检测到真正的差异。

例如,假设两个群体之间的真实效应大小为 0.5——“中等”效应大小。我们可以使用以下 R 代码来计算使用不同样本量的两个样本 t 检验的功效:

 #sample size n=10
power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power

[1] 0.1838375

#sample size n=30
power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power

[1] 0.477841

#sample size n=50
power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power

[1] 0.6968888

以下是如何解释结果:

  • 当每个样本的大小为 n = 10 时,功效为0.184
  • 当每个样本的大小为 n = 30 时,功效为0.478
  • 当每个样本的大小为 n = 50 时,功效为0.697

我们可以看到,随着样本量的增加,检验的功效也随之增加。

因此,我们不需要最小样本量来执行 t 检验,但小样本量会导致统计功效较低,从而降低检测数据真实差异的能力。

结论

以下是我们所学到的内容的总结:

  • 执行 t 检验没有最小样本量要求。
  • 如果不满足 t 检验的假设,我们必须使用非参数替代方案。
  • 如果样本量太小,t 检验的功效就会很低,并且检验检测数据中真实差异的能力也会很低。

其他资源

以下教程提供有关 t 检验的更多信息。

单样本 t 检验简介
二样本t检验简介
配对样本 t 检验简介
t 检验中提出的四个假设

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注