比例标准误差:公式和示例
在统计学中,我们通常试图估计具有某种特征的个体在总体中的比例。
例如,我们可能想要估计某个城市支持新法律的居民比例。
我们不会询问每个居民是否支持该法律,而是收集一个简单的随机样本,并找出样本中有多少居民支持该法律。
然后我们将计算样本比例 (p̂),如下所示:
比例公式示例:
p̂ = x / n
金子:
- x:样本中具有某种特征的个体数量。
- n:样本中的个体总数。
然后我们将使用这个样本比例来估计总体比例。例如,如果样本中的 300 名居民中有 47 人支持新法,则样本比例将计算如下: 47/300 = 0.157 。
这意味着我们对支持该法律的居民比例的最佳估计为0.157 。
然而,并不能保证这个估计将与真实的人口比例完全匹配,因此我们通常还会计算比例的标准误差。
计算如下:
比例公式的标准误差:
标准误差 = √ p̂(1-p̂) / n
例如,如果 p̂ = 0.157 且 n = 300,那么我们将计算该比例的标准误差如下:
比例标准误差 = √ .157(1-.157) / 300 = 0.021
然后,我们通常使用这个标准误差来计算支持该法律的居民真实比例的置信区间。
计算如下:
人口比例公式的置信区间:
置信区间 = p̂ +/- z*√ p̂(1-p̂) / n
看这个公式,很容易看出比例的标准误差越大,置信区间就越宽。
请注意,公式中的z是对应于最常见置信水平选择的 z 值:
一定程度的信心 | z值 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
例如,以下是如何计算支持新法律的城市居民真实比例的 95% 置信区间:
- 95% CI = p̂ +/- z*√ p̂(1-p̂) / n
- 95% CI = 0.157 +/- 1.96*√ 0.157(1-0.157) / 300
- 95% CI = 0.157 +/- 1.96*(0.021)
- 95% CI = [.10884, .19816]
因此,我们可以有 95% 的把握说,支持新法的城市居民的真实比例在 10,884% 到 19,816% 之间。