R で二項信頼区間を計算する方法


二項確率の信頼区間は、次の式を使用して計算されます。

信頼区間 = p +/- z*(√ p(1-p) / n )

金:

  • p: 「成功」の割合
  • z:選択された Z 値
  • n:サンプルサイズ

使用する Z 値は、選択した信頼レベルによって異なります。次の表は、最も一般的な信頼水準の選択肢に対応する Z 値を示しています。

自信のレベル Z値
0.90 1,645
0.95 1.96
0.99 2.58

たとえば、特定の法律を支持する郡の住民の割合を推定したいとします。 100 人の住民から無作為にサンプルを選択したところ、そのうち 56 人がこの法律に賛成していることがわかりました。

このチュートリアルでは、法律を支持する郡全体の住民の真の割合の信頼区間を計算する 3 つの異なる方法について説明します。

方法 1: prop.test() 関数を使用する

二項 95% 信頼区間を計算する 1 つの方法は、基数 R でprop.test()関数を使用することです。

 #calculate 95% confidence interval
prop. test (x=56, n=100, conf. level =.95, correct= FALSE )


	1-sample proportions test without continuity correction

data: 56 out of 100, null probability 0.5
X-squared = 1.44, df = 1, p-value = 0.2301
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
 0.4622810 0.6532797
sample estimates:
   p 
0.56 

この法律を支持する郡住民の実際の割合の 95% CI は[.46228, .65328]です。

方法 2: binconf() 関数を使用する

信頼区間を計算する別の方法は、 Hmiscパッケージのbinconf()関数を使用することです。

 library (Hmisc)

#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)

 PointEast Lower Upper
     0.56 0.462281 0.6532797

この信頼区間は、前の例で計算された信頼区間に対応することに注意してください。

方法 3: 信頼区間を手動で計算する

R の二項 95% 信頼区間を計算する別の方法は、手動で行うことです。

 #define proportion
p <- 56/100

#define significance level
a <- .05

#calculate 95% confidence interval
p + c(- qnorm (1-a/2), qnorm (1-a/2))* sqrt ((1/100)*p*(1-p))

[1] 0.4627099 0.6572901

qnorm()関数の詳細については、こちらをご覧ください: R の dnorm、pnorm、qnorm、および rnorm のガイド

追加リソース

R で二項テストを実行する方法
R で二項分布をプロットする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です