Как рассчитать биномиальный доверительный интервал в r
Доверительный интервал для биномиальной вероятности рассчитывается по следующей формуле:
Доверительный интервал = p +/- z*(√ p(1-p) / n )
Золото:
- p: доля «успехов»
- z: выбранное значение z
- n: размер выборки
Используемое вами значение z зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, соответствующее наиболее распространенным вариантам уровня достоверности:
Уровень доверия | значение z |
---|---|
0,90 | 1645 |
0,95 | 1,96 |
0,99 | 2,58 |
Например, предположим, что мы хотим оценить долю жителей округа, которые поддерживают определенный закон. Мы выбрали случайную выборку из 100 жителей и обнаружили, что 56 из них поддерживают закон.
В этом руководстве объясняются три различных способа расчета доверительного интервала для истинной доли жителей округа, поддерживающих закон.
Способ 1. Используйте функцию prop.test().
Один из способов расчета биномиального 95% доверительного интервала — использовать функцию prop.test() в базе R:
#calculate 95% confidence interval prop. test (x=56, n=100, conf. level =.95, correct= FALSE ) 1-sample proportions test without continuity correction data: 56 out of 100, null probability 0.5 X-squared = 1.44, df = 1, p-value = 0.2301 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4622810 0.6532797 sample estimates: p 0.56
95%-ный ДИ для истинной доли жителей округа, поддерживающих закон, составляет [0,46228, 0,65328] .
Способ 2. Используйте функцию binconf().
Другой способ рассчитать доверительный интервал — использовать функцию binconf() из пакета Hmisc :
library (Hmisc)
#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)
PointEast Lower Upper
0.56 0.462281 0.6532797
Обратите внимание, что этот доверительный интервал соответствует рассчитанному в предыдущем примере.
Способ 3: расчет доверительного интервала вручную.
Другой способ вычислить биномиальный 95% доверительный интервал в R — сделать это вручную:
#define proportion p <- 56/100 #define significance level a <- .05 #calculate 95% confidence interval p + c(- qnorm (1-a/2), qnorm (1-a/2))* sqrt ((1/100)*p*(1-p)) [1] 0.4627099 0.6572901
Узнайте больше о функции qnorm() здесь: Руководство по dnorm, pnorm, qnorm и rnorm в R.
Дополнительные ресурсы
Как выполнить биномиальный тест в R
Как построить биномиальное распределение в R