Hoe een binomiaal betrouwbaarheidsinterval in r te berekenen
Een betrouwbaarheidsinterval voor een binominale waarschijnlijkheid wordt berekend met behulp van de volgende formule:
Betrouwbaarheidsinterval = p +/- z*(√ p(1-p) / n )
Goud:
- p: aandeel “successen”
- z: de gekozen z-waarde
- n: steekproefomvang
De z-waarde die u gebruikt, hangt af van het betrouwbaarheidsniveau dat u kiest. De volgende tabel toont de z-waarde die overeenkomt met de meest voorkomende keuzes op het gebied van het betrouwbaarheidsniveau:
Een niveau van vertrouwen | z-waarde |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2.58 |
Stel dat we bijvoorbeeld een schatting willen maken van het aandeel inwoners in een provincie dat voorstander is van een bepaalde wet. We selecteren een willekeurige steekproef van 100 inwoners en constateren dat 56 van hen vóór de wet zijn.
In deze tutorial worden drie verschillende manieren uitgelegd om een betrouwbaarheidsinterval te berekenen voor het werkelijke percentage inwoners van het hele land dat de wet steunt.
Methode 1: Gebruik de functie prop.test().
Eén manier om het binominale betrouwbaarheidsinterval van 95% te berekenen is door de functie prop.test() in basis R te gebruiken:
#calculate 95% confidence interval prop. test (x=56, n=100, conf. level =.95, correct= FALSE ) 1-sample proportions test without continuity correction data: 56 out of 100, null probability 0.5 X-squared = 1.44, df = 1, p-value = 0.2301 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4622810 0.6532797 sample estimates: p 0.56
Het 95%-BI voor het werkelijke percentage inwoners van de provincie dat de wet steunt, is [.46228, .65328] .
Methode 2: Gebruik de binconf() functie
Een andere manier om het betrouwbaarheidsinterval te berekenen is door de functie binconf() uit het Hmisc- pakket te gebruiken:
library (Hmisc)
#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)
PointEast Lower Upper
0.56 0.462281 0.6532797
Merk op dat dit betrouwbaarheidsinterval overeenkomt met het interval dat in het vorige voorbeeld is berekend.
Methode 3: Bereken handmatig het betrouwbaarheidsinterval
Een andere manier om het binominale betrouwbaarheidsinterval van 95% in R te berekenen, is door dit handmatig te doen:
#define proportion p <- 56/100 #define significance level a <- .05 #calculate 95% confidence interval p + c(- qnorm (1-a/2), qnorm (1-a/2))* sqrt ((1/100)*p*(1-p)) [1] 0.4627099 0.6572901
Lees hier meer over de functie qnorm() : Een gids voor dnorm, pnorm, qnorm en rnorm in R
Aanvullende bronnen
Hoe voer je een binomiale test uit in R
Hoe een binominale verdeling in R te plotten