什么是人口比例?
在统计学中,人口比例是指人口中具有某种特征的个体所占的比例。
例如,假设某城市43.8%的居民支持一项新法律。值0.438代表人口比例。
人口比例公式
人口比例始终介于 0 和 1 之间(或 0% 到 100% 作为百分比),计算公式如下:
p = X / N
金子:
- p:人口比例
- X:群体中具有某种特征的个体数量。
- N:人口中的总人数。
如何估计人口比例
由于收集总体中每个个体的数据通常过于耗时且昂贵,因此我们通常收集样本数据。
例如,假设我们想知道某个城市有多少比例的居民支持一项新法律。如果人口总数由 50,000 名居民组成,我们可以对 1,000 名居民进行简单的随机抽样:
然后我们将计算样本比例如下:
p̂ = x / n
金子:
- p̂:样本比例
- x:样本中具有某种特征的个体数量。
- n:样本中的个体总数。
然后我们将使用这个样本比例来估计总体比例。例如,如果样本中的 1,000 名居民中有 367 人支持新法,则样本比例将计算如下: 367/1,000 = 0.367 。
因此,我们对支持该法律的居民比例的最佳估计为 0.367 。
一部分人口的置信区间
尽管样本比例为我们提供了真实总体比例的估计,但不能保证样本比例与总体比例完全匹配。
为此,我们一般会构建一个置信区间——可能包含高置信度总体真实比例的一系列值。
总体比例置信区间的计算公式如下:
置信区间 = p̂ +/- z*√ p̂(1-p̂) / n
金子:
- p̂:样本比例
- z:选择的z值
- n:样本量
您使用的 z 值取决于您选择的置信水平。下表显示了与最常见的置信水平选择相对应的 z 值:
一定程度的信心 | z值 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
请注意,较高的置信水平对应于较大的 z 值,这会导致更宽的置信区间。这意味着,例如,对于同一数据集,95% 置信区间将比 90% 置信区间更宽。
示例:一定比例人口的置信区间
假设我们想要估计一个城市中支持某项法律的居民比例。我们随机抽取 100 名居民作为样本,询问他们对法律的立场。结果如下:
- 样本量n = 100
- 支持该法律的比例p̂ = 0.56
以下是如何找到人口比例的不同置信区间:
90% 置信区间: 0.56 +/- 1.645*(√ 0.56(1-0.56) / 100 ) = [0.478, 0.642]
95% 置信区间: 0.56 +/- 1.96*(√ 0.56(1-0.56) / 100 ) = [0.463, 0.657]
99% 置信区间: 0.56 +/- 2.58*(√ 0.56(1-0.56) / 100 ) = [0.432, 0.688]
注意:您还可以使用比例计算器的置信区间找到这些置信区间。