T 检验中提出的四个假设
双样本 t 检验用于检验两个总体的均值是否相等。
此类测试对数据做出以下假设:
1. 独立性:一个样本的观察结果独立于另一样本的观察结果。
2. 正态性:两个样本都具有近似正态分布。
3.方差齐性:两个样本的方差大致相同。
4. 随机抽样:两个样本均采用随机抽样方法获得。
如果违反这些假设中的一个或多个,则双样本 t 检验的结果可能不可靠,甚至具有误导性。
在本教程中,我们对每个假设进行了解释,如何确定假设是否满足,以及如果违反假设该怎么办。
假设1:独立性
双样本 t 检验假设一个样本的观察结果独立于另一样本的观察结果。
这是一个至关重要的假设,因为如果两个样本中都出现相同的个体,那么得出关于样本之间差异的结论是无效的。
如何验证这个假设
检验此假设的最简单方法是验证每个观测值在每个样本中仅出现一次,并且每个样本中的观测值是通过随机抽样收集的。
如果不遵守此假设该怎么办
如果不满足这一假设,则双样本 t 检验结果完全无效。在这种情况下,最好使用随机抽样方法收集两个新样本,并确保一个样本中的每个个体不属于另一个样本。
假设2:正态性
双样本 t 检验假设两个样本近似呈正态分布。
这是一个至关重要的假设,因为如果样本不呈正态分布,则使用检验中的 p 值得出有关样本之间差异的结论是无效的。
如何验证这个假设
如果样本量较小(n < 50),那么我们可以使用 Shapiro-Wilk 检验来确定每个样本量是否服从正态分布。如果检验的 p 值低于一定的显着性水平,则数据可能不呈正态分布。
如果样本量较大,最好使用QQ图直观地检查数据是否服从正态分布。
如果数据点大致沿着 QQ 图中的对角线分布,则数据集可能服从正态分布。
如果不遵守此假设该怎么办
如果违反了这个假设,那么我们可以执行Mann-Whitney U 检验,它被认为是双样本 t 检验的非参数等效项,并且不假设两个样本呈正态分布。
假设3:差异同质性
双样本 t 检验假设两个样本的方差大致相等。
如何验证这个假设
我们使用以下经验法则来确定两个样本之间的方差是否相等:如果最大方差与最小方差的比率小于 4,则我们可以假设方差近似相等并使用两个样本 t -测试。
例如,假设样本 1 的方差为 24.5,样本 2 的方差为 15.2。最大样本方差与最小样本方差之比计算如下:
比率: 24.5 / 15.2 = 1.61
该比率小于 4,可以假设两组之间的差异大致相等。
如果不遵守此假设该怎么办
如果违反了这个假设,那么我们可以执行Welch t 检验,它是双样本 t 检验的非参数版本,并且不假设两个样本具有相等的方差。
假设 4:随机抽样
双样本 t 检验假设两个样本都是使用随机抽样方法获得的。
如何验证这个假设
我们没有可以用来检验这一假设的正式统计检验。相反,我们只需要确保两个样本都是使用随机抽样方法获得的,以便感兴趣群体中的每个个体都有相同的概率被包含在一个或另一个样本中。
如果不遵守此假设该怎么办
如果不满足这个假设,那么我们的两个样本不太可能代表感兴趣的总体。在这种情况下,我们无法可靠地将双样本 t 检验的结果推广到总体。
在这种情况下,最好使用随机抽样方法收集两个新样本。