R で二項信頼区間を計算する方法
二項確率の信頼区間は、次の式を使用して計算されます。
信頼区間 = p +/- z*(√ p(1-p) / n )
金:
- p: 「成功」の割合
- z:選択された Z 値
- n:サンプルサイズ
使用する Z 値は、選択した信頼レベルによって異なります。次の表は、最も一般的な信頼水準の選択肢に対応する Z 値を示しています。
自信のレベル | Z値 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
たとえば、特定の法律を支持する郡の住民の割合を推定したいとします。 100 人の住民から無作為にサンプルを選択したところ、そのうち 56 人がこの法律に賛成していることがわかりました。
このチュートリアルでは、法律を支持する郡全体の住民の真の割合の信頼区間を計算する 3 つの異なる方法について説明します。
方法 1: prop.test() 関数を使用する
二項 95% 信頼区間を計算する 1 つの方法は、基数 R でprop.test()関数を使用することです。
#calculate 95% confidence interval prop. test (x=56, n=100, conf. level =.95, correct= FALSE ) 1-sample proportions test without continuity correction data: 56 out of 100, null probability 0.5 X-squared = 1.44, df = 1, p-value = 0.2301 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4622810 0.6532797 sample estimates: p 0.56
この法律を支持する郡住民の実際の割合の 95% CI は[.46228, .65328]です。
方法 2: binconf() 関数を使用する
信頼区間を計算する別の方法は、 Hmiscパッケージのbinconf()関数を使用することです。
library (Hmisc)
#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)
PointEast Lower Upper
0.56 0.462281 0.6532797
この信頼区間は、前の例で計算された信頼区間に対応することに注意してください。
方法 3: 信頼区間を手動で計算する
R の二項 95% 信頼区間を計算する別の方法は、手動で行うことです。
#define proportion p <- 56/100 #define significance level a <- .05 #calculate 95% confidence interval p + c(- qnorm (1-a/2), qnorm (1-a/2))* sqrt ((1/100)*p*(1-p)) [1] 0.4627099 0.6572901
qnorm()関数の詳細については、こちらをご覧ください: R の dnorm、pnorm、qnorm、および rnorm のガイド