T 检验的最小样本量:解释和示例
学生提出的一个常见问题是:
执行 t 检验是否需要最小样本量?
简短的回答:
不需要。执行 t 检验没有最小样本量要求。
事实上,第一次使用的t检验只使用了四个人的样本。
但是,如果不满足 t 检验的假设,则结果可能不可靠。
此外,如果样本量太小,检验的功效可能太低,无法检测数据中的显着差异。
让我们更详细地看看这些潜在问题。
了解 t 检验假设
单样本 t 检验用于测试总体平均值是否等于某个值。
该测试做出以下假设:
- 独立性:样本观察必须是独立的。
- 随机抽样:应使用随机抽样方法收集观察结果,以最大限度地提高样本代表感兴趣总体的机会。
- 正态性:观察值应近似正态分布。
双样本 t 检验用于检查两个总体的平均值之间是否存在显着差异。
该测试做出以下假设:
- 独立性:每个样本的观察结果必须是独立的。
- 随机抽样:应使用随机抽样方法收集每个样本的观察结果。
- 正态性:每个样本应近似正态分布。
- 方差相等:每个样本应具有大致相同的方差。
在执行每种类型的 t 检验时,如果不满足这些假设中的一个或多个,则检验结果可能会变得不可靠。
在这种情况下,最好使用不做出这些假设的替代非参数检验。
单样本 t 检验的非参数替代方法是Wilcoxon 符号秩检验。
两样本 t 检验的非参数替代方法是曼-惠特尼 U 检验。
了解 t 检验的威力
统计功效是指测试检测到实际存在的效果的概率。
可以看出,使用的样本量越小,给定测试的统计功效就越低。这就是为什么研究人员通常需要更大的样本量,以获得更高的功效,从而更有可能检测到真正的差异。
例如,假设两个群体之间的真实效应大小为 0.5——“中等”效应大小。我们可以使用以下 R 代码来计算使用不同样本量的两个样本 t 检验的功效:
#sample size n=10 power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.1838375 #sample size n=30 power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.477841 #sample size n=50 power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.6968888
以下是如何解释结果:
- 当每个样本的大小为 n = 10 时,功效为0.184 。
- 当每个样本的大小为 n = 30 时,功效为0.478 。
- 当每个样本的大小为 n = 50 时,功效为0.697 。
我们可以看到,随着样本量的增加,检验的功效也随之增加。
因此,我们不需要最小样本量来执行 t 检验,但小样本量会导致统计功效较低,从而降低检测数据真实差异的能力。
结论
以下是我们所学到的内容的总结:
- 执行 t 检验没有最小样本量要求。
- 如果不满足 t 检验的假设,我们必须使用非参数替代方案。
- 如果样本量太小,t 检验的功效就会很低,并且检验检测数据中真实差异的能力也会很低。
其他资源
以下教程提供有关 t 检验的更多信息。