比例的置信区间


比例的置信区间是可能包含具有一定置信水平的总体比例的值范围。

本教程解释了以下内容:

  • 创建比例置信区间的动机。
  • 创建比例置信区间的公式。
  • 如何计算比例置信区间的示例。
  • 如何解释比例的置信区间。

比例的置信区间:动机

为比例创建置信区间的原因是为了在估计人口比例时捕捉我们的不确定性。

例如,假设我们想要估计某个县支持某项法律的人口比例。由于该县有数千名居民,如果要四处询问每个居民对法律的立场,成本太高,也太耗时。

相反,我们可以选择一个简单的随机居民样本,并询问每个人是否支持该法律:

人口比例估算示例

由于我们是随机抽取居民样本,因此无法保证样本中支持法律的居民比例与全县支持法律的居民比例完全匹配。

因此,为了捕捉这种不确定性,我们可以创建一个包含一系列值的置信区间,这些值可能包含全县支持该法律的居民的真实比例。

比例的置信区间:公式

我们使用以下公式来计算总体比例的置信区间:

置信区间 = p +/- z*√ p(1-p) / n

金子:

  • p:样本比例
  • z:选择的z值
  • n:样本量

您使用的 z 值取决于您选择的置信水平。下表显示了与最常见的置信水平选择相对应的 z 值:

一定程度的信心 z值
0.90 1,645
0.95 1.96
0.99 2.58

请注意,较高的置信水平对应于较大的 z 值,这会导致更宽的置信区间。

这意味着,例如,对于同一数据集,95% 置信区间将比 90% 置信区间更宽。

相关:什么被认为是良好的置信区间?

比例的置信区间:示例

假设我们想要估计一个县中支持某项法律的居民比例。我们随机抽取 100 名居民作为样本,询问他们对法律的立场。结果如下:

  • 样本量n = 100
  • 支持该法律的比例p = 0.56

以下是如何找到人口比例的不同置信区间:

90% 置信区间: 0.56 +/- 1.645*(√ 0.56(1-0.56) / 100 ) = [0.478, 0.642]

95% 置信区间: 0.56 +/- 1.96*(√ 0.56(1-0.56) / 100 ) = [0.463, 0.657]

99% 置信区间: 0.56 +/- 2.58*(√ 0.56(1-0.56) / 100 ) = [0.432, 0.688]

注意:您还可以使用比例计算器的置信区间找到这些置信区间。

比例的置信区间:解释

我们解释置信区间的方式是:

置信区间 [0.463, 0.657] 包含支持该法律的居民的真实比例的可能性为 95%。

同一件事的另一种说法是,人口的真实比例只有 5% 的可能性位于 95% 置信区间之外。

也就是说,支持该法律的县城居民的真实比例低于46.3%或高于65.7%的可能性只有5%。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注