Betrouwbaarheidsniveau en betrouwbaarheidsinterval: wat is het verschil?
Vaak proberen we in de statistieken populatieparameters te meten – getallen die bepaalde kenmerken van een hele populatie beschrijven.
We zijn bijvoorbeeld misschien geïnteresseerd in het meten van de gemiddelde lengte van mannen in een bepaald land.
Omdat het te duur en tijdrovend is om gegevens te verzamelen over de lengte van elke man in het land, zouden we in plaats daarvan gegevens verzamelen over een eenvoudige willekeurige steekproef van mannen. We zouden dan de gemiddelde lengte van de mannen in deze steekproef gebruiken om de gemiddelde lengte van alle mannen in het land te schatten.
Helaas is het niet gegarandeerd dat de gemiddelde lengte van mannen in de steekproef exact overeenkomt met de gemiddelde lengte van mannen in de gehele populatie. We kunnen bijvoorbeeld een steekproef van kleinere mannen kiezen, of misschien een steekproef van langere mannen.
Om onze onzekerheid rond onze schatting van het werkelijke populatiegemiddelde vast te leggen, kunnen we een betrouwbaarheidsinterval creëren.
Betrouwbaarheidsinterval: bereik van waarden die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevatten.
Een betrouwbaarheidsinterval wordt berekend met behulp van de volgende algemene formule:
Betrouwbaarheidsinterval = (puntschatting) +/- (kritieke waarde)* (standaardfout)
De formule voor het berekenen van een betrouwbaarheidsinterval voor een populatiegemiddelde is bijvoorbeeld:
Betrouwbaarheidsinterval = x +/- z*(s/√ n )
Goud:
- x : steekproefgemiddelden
- z: de kritische waarde van z
- s: standaardafwijking van het monster
- n: steekproefomvang
De kritische z-waarde die u in de formule gebruikt, is afhankelijk van het betrouwbaarheidsniveau dat u kiest.
Betrouwbaarheidsniveau: Percentage van alle mogelijke monsters waarvan wordt verwacht dat ze de werkelijke populatieparameter bevatten.
De meest voorkomende keuzes voor betrouwbaarheidsniveaus zijn 90%, 95% en 99%.
De volgende tabel toont de kritische z-waarde die overeenkomt met deze populaire keuzes op het gebied van het betrouwbaarheidsniveau:
Een niveau van vertrouwen | z kritische waarde |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2.58 |
Stel bijvoorbeeld dat we de lengtes van 25 mannen hebben gemeten en het volgende hebben gevonden:
- Steekproefomvang n = 25
- Gemiddelde monsterhoogte x = 70 inch
- Standaardafwijking van het monster s = 1,2 inch
Zo berekent u een betrouwbaarheidsinterval voor de werkelijke gemiddelde populatiegrootte met een betrouwbaarheidsniveau van 90% :
90% betrouwbaarheidsinterval: 70 +/- 1,645*(1,2/√25) = [69,6052, 70,3948]
Dit betekent dat als we dezelfde steekproefmethode zouden gebruiken om verschillende steekproeven te selecteren en voor elk monster een betrouwbaarheidsinterval zouden berekenen, we zouden verwachten dat de werkelijke gemiddelde populatiegrootte 90% van de tijd binnen het interval zou vallen.
Stel nu dat we in plaats daarvan een betrouwbaarheidsinterval berekenen met een betrouwbaarheidsniveau van 95%:
95% betrouwbaarheidsinterval: 70 +/- 1,96*(1,2/√25) = [69,5296, 70,4704]
Merk op dat dit betrouwbaarheidsinterval breder is dan het vorige. Hoe hoger het betrouwbaarheidsniveau, hoe breder het betrouwbaarheidsinterval.
Hoe hoger het betrouwbaarheidsniveau, hoe breder het betrouwbaarheidsinterval.
Dit zou intuïtief logisch moeten zijn: een breder betrouwbaarheidsniveau heeft een grotere kans een echte populatieparameter te bevatten.
Samenvatting
Samengevat:
Een betrouwbaarheidsinterval is een reeks waarden die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevatten. Er wordt gebruik gemaakt van de volgende basisformule:
Betrouwbaarheidsinterval = (puntschatting) +/- (kritieke waarde)* (standaardfout)
Het betrouwbaarheidsniveau bepaalt de kritische waarde die in deze formule moet worden gebruikt. Hoe hoger het betrouwbaarheidsniveau, hoe groter de kritische waarde en dus hoe breder het betrouwbaarheidsinterval.
Aanvullende bronnen
Inleiding tot betrouwbaarheidsintervallen
Inleiding tot het testen van hypothesen
Wat is een puntschatting?