R에서 이항 신뢰 구간을 계산하는 방법
이항 확률에 대한 신뢰 구간은 다음 공식을 사용하여 계산됩니다.
신뢰구간 = p +/- z*(√ p(1-p) / n )
금:
- p: “성공” 비율
- z: 선택된 z 값
- n: 표본 크기
사용하는 z 값은 선택한 신뢰 수준에 따라 달라집니다. 다음 표에는 가장 일반적인 신뢰 수준 선택에 해당하는 z 값이 나와 있습니다.
어느 정도의 자신감 | z 값 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
예를 들어, 특정 법률을 선호하는 카운티 주민의 비율을 추정한다고 가정해 보겠습니다. 우리는 100명의 주민 중 무작위 표본을 선택했고 그 중 56명이 법에 찬성한다는 것을 알아냈습니다.
이 튜토리얼에서는 법을 지지하는 카운티 주민의 실제 비율에 대한 신뢰 구간을 계산하는 세 가지 방법을 설명합니다.
방법 1: prop.test() 함수 사용
이항 95% 신뢰 구간을 계산하는 한 가지 방법은 기본 R에서 prop.test() 함수를 사용하는 것입니다.
#calculate 95% confidence interval prop. test (x=56, n=100, conf. level =.95, correct= FALSE ) 1-sample proportions test without continuity correction data: 56 out of 100, null probability 0.5 X-squared = 1.44, df = 1, p-value = 0.2301 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4622810 0.6532797 sample estimates: p 0.56
해당 법을 지지하는 카운티 주민의 실제 비율에 대한 95% CI는 [.46228, .65328] 입니다.
방법 2: binconf() 함수 사용
신뢰 구간을 계산하는 또 다른 방법은 Hmisc 패키지의 binconf() 함수를 사용하는 것입니다.
library (Hmisc)
#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)
PointEast Lower Upper
0.56 0.462281 0.6532797
이 신뢰 구간은 이전 예에서 계산된 신뢰 구간과 일치합니다.
방법 3: 신뢰 구간을 수동으로 계산
R에서 이항 95% 신뢰 구간을 계산하는 또 다른 방법은 수동으로 계산하는 것입니다.
#define proportion p <- 56/100 #define significance level a <- .05 #calculate 95% confidence interval p + c(- qnorm (1-a/2), qnorm (1-a/2))* sqrt ((1/100)*p*(1-p)) [1] 0.4627099 0.6572901
여기에서 qnorm() 함수에 대해 자세히 알아보세요. R의 dnorm, pnorm, qnorm 및 rnorm에 대한 가이드