Jak obliczyć dwumianowy przedział ufności w r
Przedział ufności dla prawdopodobieństwa dwumianowego oblicza się za pomocą następującego wzoru:
Przedział ufności = p +/- z*(√ p(1-p) / n )
Złoto:
- p: proporcja „sukcesów”
- z: wybrana wartość z
- n: wielkość próbki
Używana wartość z zależy od wybranego poziomu ufności. W poniższej tabeli przedstawiono wartość z odpowiadającą najczęściej wybieranym poziomom ufności:
Poziom pewności | wartość z |
---|---|
0,90 | 1645 |
0,95 | 1,96 |
0,99 | 2,58 |
Załóżmy na przykład, że chcemy oszacować odsetek mieszkańców hrabstwa, którzy opowiadają się za określonym prawem. Wybieramy losową próbę 100 mieszkańców i stwierdzamy, że 56 z nich opowiada się za prawem.
W tym samouczku wyjaśniono trzy różne sposoby obliczania przedziału ufności dla prawdziwego odsetka mieszkańców całego hrabstwa, którzy popierają prawo.
Metoda 1: Użyj funkcji prop.test().
Jednym ze sposobów obliczenia dwumianowego 95% przedziału ufności jest użycie funkcji prop.test() w bazie R:
#calculate 95% confidence interval prop. test (x=56, n=100, conf. level =.95, correct= FALSE ) 1-sample proportions test without continuity correction data: 56 out of 100, null probability 0.5 X-squared = 1.44, df = 1, p-value = 0.2301 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4622810 0.6532797 sample estimates: p 0.56
95% CI dla prawdziwego odsetka mieszkańców hrabstwa popierających prawo wynosi [0,46228, 0,65328] .
Metoda 2: Użyj funkcji binconf().
Innym sposobem obliczenia przedziału ufności jest użycie funkcji binconf() z pakietu Hmisc :
library (Hmisc)
#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)
PointEast Lower Upper
0.56 0.462281 0.6532797
Należy zauważyć, że ten przedział ufności odpowiada przedziałowi ufności obliczonemu w poprzednim przykładzie.
Metoda 3: Ręcznie oblicz przedział ufności
Innym sposobem obliczenia dwumianowego 95% przedziału ufności w R jest zrobienie tego ręcznie:
#define proportion p <- 56/100 #define significance level a <- .05 #calculate 95% confidence interval p + c(- qnorm (1-a/2), qnorm (1-a/2))* sqrt ((1/100)*p*(1-p)) [1] 0.4627099 0.6572901
Dowiedz się więcej o funkcji qnorm() tutaj: Przewodnik po dnorm, pnorm, qnorm i rnorm w R
Dodatkowe zasoby
Jak wykonać test dwumianowy w R
Jak wykreślić rozkład dwumianowy w R