Wat is de voorwaarde 'geslaagd/mislukt' in de statistieken?
Een Bernoulli-proef is een experiment met slechts twee mogelijke uitkomsten – ‘succes’ of ‘mislukking’ – en de kans op succes is elke keer dat het experiment wordt uitgevoerd hetzelfde.
Een voorbeeld van een Bernoulli-essay is het opgooien van munten. De munt kan slechts op twee kop landen (we zouden kop een „hit“ kunnen noemen en staart een „mislukking“) en de kans op succes bij elke opgooi is 0,5, ervan uitgaande dat de munt eerlijk is.
Als we in de statistiek waarschijnlijkheden willen berekenen waarbij meer dan een paar Bernoulli-pogingen betrokken zijn, gebruiken we vaak denormale verdeling als benadering. Om dit te doen moeten we echter controleren of aan de voorwaarde voor slagen/mislukken is voldaan:
Pass/Fail-voorwaarde: Er moeten minstens 10 verwachte successen en 10 verwachte mislukkingen in een steekproef zijn om de normale verdeling als benadering te kunnen gebruiken.
Geschreven in notatie, moeten we de volgende twee dingen controleren:
- Het verwachte aantal successen is minimaal 10: np ≥ 10
- Het verwachte aantal storingen bedraagt minimaal 10: n(1-p) ≥ 10
waarbij n de steekproefomvang is en p de kans op succes voor een bepaalde proef.
Opmerking: Sommige handleidingen zeggen in plaats daarvan dat er slechts vijf verwachte successen en vijf verwachte mislukkingen nodig zijn om de normale benadering te gebruiken. 10 wordt echter vaker gebruikt en is een conservatiever getal. Daarom zullen we dit nummer in deze tutorial gebruiken.
Voorbeeld: Controle van de voorwaarde ‚geslaagd/mislukt‘
Stel dat we een betrouwbaarheidsinterval willen creëren voor het aandeel inwoners van een provincie dat voorstander is van een bepaalde wet. We selecteren een willekeurige steekproef van 100 inwoners en vragen hen wat hun standpunt is over de wet. Hier zijn de resultaten:
- Steekproefgrootte n = 100
- Aandeel ten gunste van de wet p = 0,56
Om het betrouwbaarheidsinterval te berekenen, willen we de volgende formule gebruiken:
Betrouwbaarheidsinterval = p +/- z*√ p(1-p) / n
Goud:
- p: steekproefaandeel
- z: de z-waarde die overeenkomt met de normale verdeling
- n: steekproefomvang
Deze formule gebruikt een z-waarde uit de normale verdeling. In deze formule gebruiken we dus de normale verdeling om de binominale verdeling te benaderen.
Om dit te doen moeten we echter verifiëren dat aan de voorwaarde voor slagen/mislukken is voldaan. Laten we controleren of het aantal successen en het aantal mislukkingen in de steekproef minimaal 10 is:
Aantal successen: np = 100*.56 = 56
Aantal storingen: n(1-p) = 100*(1-.56) = 44
Beide getallen zijn gelijk aan of groter dan 10, dus we kunnen de bovenstaande formule gebruiken om het betrouwbaarheidsinterval te berekenen.
Aanvullende bronnen
Een andere voorwaarde waaraan moet worden voldaan om de normale verdeling als benadering van de binomiale verdeling te gebruiken, is dat de steekproefomvang waarmee we werken niet groter is dan 10% van de populatieomvang. Dit wordt de 10%-voorwaarde genoemd.
Houd er ook rekening mee dat als u met twee verhoudingen werkt (bijvoorbeeld door een betrouwbaarheidsinterval te creëren voor het verschil tussen de verhoudingen ), u moet controleren of het verwachte aantal successen en mislukkingen in de twee steekproeven minimaal 10 bedraagt.