平均值之间差异的置信区间
均值差异的置信区间 (CI)是可能包含具有一定置信水平的两个总体均值之间的真实差异的值范围。
本教程解释了以下内容:
- 创建此置信区间的动机。
- 创建此置信区间的公式。
- 如何计算此置信区间的示例。
- 如何解释这个置信区间。
CI 表示手段之间的差异:动机
研究人员经常想要估计两个总体平均值之间的差异。为了估计这种差异,他们将从每个总体中收集随机样本并计算每个样本的平均值。然后他们可以比较两个平均值之间的差异。
然而,他们无法确定样本均值之间的差异是否对应于总体均值之间的真实差异。这就是为什么他们可以为两个均值之间的差异创建置信区间。这提供了可能包含总体均值之间的真实差异的一系列值。
例如,假设我们想要估计两种不同种类的海龟之间的平均体重差异。由于每个种群中有数千只海龟,因此四处走动并单独称量每只海龟既耗时又昂贵。
相反,我们可以从每个种群中随机抽取 15 只海龟,并使用每个样本的平均体重来估计两个种群之间平均体重的真实差异:
问题是我们的样本是随机的,因此不能保证两个样本之间的平均权重差异与两个总体之间的平均权重差异完全匹配。因此,为了捕捉这种不确定性,我们可以创建一个包含一系列值的置信区间,这些值可能包含两个群体之间平均体重的真实差异。
CI 表示平均值之间的差异:公式
我们使用以下公式来计算两个均值之间差异的置信区间:
置信区间= ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
金子:
- x 1 , x 2 :样本 1 的平均值,样本 2 的平均值
- t:基于置信水平和 (n 1 + n 2 -2) 自由度的 t 临界值
- sp 2 :合并方差
- n 1 , n 2 : 样本量 1, 样本量 2
金子:
- 合并方差计算如下: s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- t 临界值t可以使用逆 t 分布计算器找到。
CI 均值差异:示例
假设我们想要估计两种不同种类的海龟之间的平均体重差异。因此,我们将从每个种群中随机收集 15 只海龟样本。以下是每个样本的摘要数据:
样本1:
- x1 = 310
- s 1 = 18.5
- n 1 = 15
样本2:
- x2 = 300
- s2 = 16.4
- n2 = 15
以下是如何找到总体平均权重真实差异的不同置信区间的方法:
90% 置信区间:
(310-300) +/- 1.70*√((305.61/15) + (305.61/15)) = [-0.8589, 20.8589]
95% 置信区间:
(310-300) +/- 2.05*√((305.61/15) + (305.61/15)) = [-3.0757, 23.0757]
99% 置信区间:
(310-300) +/- 2.76*√((305.61/15) + (305.61/15)) = [-7.6389, 27.6389]
注意:您还可以使用均值差异统计置信区间计算器查找这些置信区间。
您会注意到置信水平越高,置信区间越宽。这应该是有道理的,因为更宽的区间更有可能包含真实的总体平均值,因此我们更“有信心”该区间包含真实的总体平均值。
CI 均值差异:解释
我们解释置信区间的方式是:
[-3.0757, 23.0757] 的置信区间有 95% 的可能性包含两个海龟种群之间平均体重的真实差异。
由于该区间包含值“0”,这意味着这两个种群的海龟之间的平均体重可能没有差异。换句话说,我们不能有 95% 的置信度说这两个种群的海龟之间的平均体重存在差异。