平均值的置信区间


均值的置信区间是可能包含具有一定置信水平的总体均值的值范围。

本教程解释了以下内容:

  • 创建平均值置信区间的动机。
  • 创建均值置信区间的公式。
  • 如何计算平均值的置信区间的示例。
  • 如何解释平均值的置信区间。

平均值的置信区间:动机

我们甚至想要为均值创建置信区间的原因是我们希望在估计总体均值时捕获不确定性。

例如,假设我们想要估计佛罗里达州某种海龟的平均重量。由于佛罗里达州有数千只海龟,因此四处走动并单独称重每只海龟将非常耗时且昂贵。

相反,我们可以抽取 50 只海龟的简单随机样本,并使用该样本中海龟的平均重量来估计真实的种群平均值:

示例总体的样本

问题在于样本的平均权重不能保证与整个总体的平均权重完全匹配。因此,为了捕捉这种不确定性,我们可以创建一个置信区间,其中包含一系列可能包含海龟在种群中的真实平均体重的值。

平均值的置信区间:公式

我们使用以下公式来计算平均值的置信区间:

置信区间 = x +/- z*(s/√ n )

金子:

  • x样本均值
  • z:选择的z值
  • s:样本标准差
  • n:样本量

您使用的 z 值取决于您选择的置信水平。下表显示了与最常见的置信水平选择相对应的 z 值:

一定程度的信心 z值
0.90 1,645
0.95 1.96
0.99 2.58

请注意,较高的置信水平对应于较大的 z 值,这会导致更宽的置信区间。这意味着,例如,对于同一数据集,99% 置信区间将比 95% 置信区间更宽。

平均值的置信区间:示例

假设我们随机收集海龟样本,其中包含以下信息:

  • 样本量n = 25
  • 平均样本重量x = 300
  • 样本标准差s = 18.5

以下是如何找到总体真实平均权重的不同置信区间的方法:

90% 置信区间: 300 +/- 1.645*(18.5/√ 25 ) = [293.91, 306.09]

95% 置信区间: 300 +/- 1.96*(18.5/√ 25 ) = [292.75, 307.25]

99% 置信区间: 300 +/- 2.58*(18.5/√ 25 ) = [ 290.47 , 309.53]

注意:您还可以使用统计置信区间计算器查找这些置信区间。

平均值的置信区间:解释

我们解释置信区间的方式是:

[292.75, 307.25] 的置信区间包含海龟种群的真实平均体重的可能性为 95%。

同一件事的另一种说法是,真实总体平均值只有 5% 的可能性位于 95% 置信区间之外。也就是说,海龟种群的实际平均体重大于 307.25 磅或小于 292.75 磅的可能性只有 5%。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注