如何计算 r 中的二项式置信区间
二项式概率的置信区间使用以下公式计算:
置信区间 = p +/- z*(√ p(1-p) / n )
金子:
- p: “成功”的比例
- z:选择的z值
- n:样本量
您使用的 z 值取决于您选择的置信水平。下表显示了与最常见的置信水平选择相对应的 z 值:
一定程度的信心 | z值 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
例如,假设我们想要估计一个县中支持某项法律的居民比例。我们随机抽取了 100 名居民,发现其中 56 人支持这项法律。
本教程解释了计算支持该法律的全县居民真实比例置信区间的三种不同方法。
方法一:使用prop.test()函数
计算二项式 95% 置信区间的一种方法是使用基 R 中的prop.test()函数:
#calculate 95% confidence interval prop. test (x=56, n=100, conf. level =.95, correct= FALSE ) 1-sample proportions test without continuity correction data: 56 out of 100, null probability 0.5 X-squared = 1.44, df = 1, p-value = 0.2301 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4622810 0.6532797 sample estimates: p 0.56
支持该法律的县居民真实比例的 95% CI 为[.46228, .65328] 。
方法2:使用binconf()函数
计算置信区间的另一种方法是使用Hmisc包中的binconf()函数:
library (Hmisc)
#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)
PointEast Lower Upper
0.56 0.462281 0.6532797
请注意,此置信区间对应于上一示例中计算的置信区间。
方法三:手动计算置信区间
在 R 中计算二项式 95% 置信区间的另一种方法是手动执行:
#define proportion p <- 56/100 #define significance level a <- .05 #calculate 95% confidence interval p + c(- qnorm (1-a/2), qnorm (1-a/2))* sqrt ((1/100)*p*(1-p)) [1] 0.4627099 0.6572901
在此处了解有关qnorm()函数的更多信息: R 中的 dnorm、pnorm、qnorm 和 rnorm 指南