Wat zijn betrouwbaarheidsintervallen?
In de statistiek zijn we vaak geïnteresseerd in het meten van populatieparameters , dat wil zeggen getallen die bepaalde kenmerken van een hele populatie beschrijven.
Twee van de meest voorkomende populatieparameters zijn:
1. Populatiegemiddelde: de gemiddelde waarde van een variabele in een populatie (bijvoorbeeld de gemiddelde lengte van mannen in de Verenigde Staten)
2. Bevolkingsaandeel: het aandeel van een variabele in een populatie (bijvoorbeeld het aandeel inwoners van een provincie dat een bepaalde wet steunt)
Zelfs als we deze parameters willen meten, is het over het algemeen te duur en tijdrovend om gegevens over elk individu in een populatie te verzamelen om de populatieparameter te berekenen.
In plaats daarvan nemen we doorgaans een willekeurige steekproef uit de totale populatie en gebruiken we de steekproefgegevens om de populatieparameter te schatten.
Laten we bijvoorbeeld zeggen dat we het gemiddelde gewicht van een bepaalde schildpadsoort in Florida willen schatten. Aangezien er duizenden schildpadden in Florida zijn, zou het extreem tijdrovend en duur zijn om elke schildpad afzonderlijk te wegen.
In plaats daarvan zouden we een eenvoudige willekeurige steekproef van 50 schildpadden kunnen nemen en het gemiddelde gewicht van de schildpadden in die steekproef gebruiken om het werkelijke populatiegemiddelde te schatten:
Het probleem is dat het niet gegarandeerd is dat het gemiddelde gewicht van de schildpadden in de steekproef exact overeenkomt met het gemiddelde gewicht van de schildpadden in de gehele populatie. We kunnen bijvoorbeeld een monster vol schildpadden met een laag gewicht kiezen of misschien een monster vol zware schildpadden.
Om deze onzekerheid vast te leggen, kunnen we een betrouwbaarheidsinterval creëren. Een betrouwbaarheidsinterval is een reeks waarden die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevatten. Het wordt berekend volgens de volgende algemene formule:
Betrouwbaarheidsinterval = (puntschatting) +/- (kritieke waarde)* (standaardfout)
Deze formule creëert een interval met een ondergrens en een bovengrens, die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevat.
Betrouwbaarheidsinterval = [ondergrens, bovengrens]
De formule voor het berekenen van een betrouwbaarheidsinterval voor een populatiegemiddelde is bijvoorbeeld:
Betrouwbaarheidsinterval = x +/- z*(s/√ n )
Goud:
- x : steekproefgemiddelde
- z: de gekozen z-waarde
- s: standaardafwijking van het monster
- n: steekproefomvang
De z-waarde die u gebruikt, hangt af van het betrouwbaarheidsniveau dat u kiest. De volgende tabel toont de z-waarde die overeenkomt met de meest voorkomende keuzes op het gebied van het betrouwbaarheidsniveau:
Een niveau van vertrouwen | z-waarde |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2.58 |
Stel dat we bijvoorbeeld een willekeurige steekproef van schildpadden verzamelen met de volgende informatie:
- Steekproefomvang n = 25
- Gemiddeld monstergewicht x = 300
- Steekproefstandaardafwijking s = 18,5
Zo berekent u het 90% betrouwbaarheidsinterval voor het werkelijke populatiegemiddelde gewicht:
90% betrouwbaarheidsinterval: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
We interpreteren dit betrouwbaarheidsinterval als volgt:
Er is een kans van 90% dat het betrouwbaarheidsinterval van [293,91, 306,09] het werkelijke gemiddelde gewicht van de schildpadpopulatie bevat.
Een andere manier om hetzelfde te zeggen is dat er slechts een kans van 10% is dat het werkelijke populatiegemiddelde buiten het betrouwbaarheidsinterval van 90% ligt. Dat wil zeggen, er is slechts een kans van 10% dat het werkelijke gemiddelde gewicht van de schildpadpopulatie groter is dan 306,09 pond of minder dan 293,91 pond.
Het is niets waard dat er twee getallen zijn die de grootte van een betrouwbaarheidsinterval kunnen beïnvloeden:
1. Steekproefomvang: hoe groter de steekproefomvang, hoe smaller het betrouwbaarheidsinterval.
2. Het betrouwbaarheidsniveau: Hoe hoger het betrouwbaarheidsniveau, hoe breder het betrouwbaarheidsinterval.
Soorten betrouwbaarheidsintervallen
Er zijn veel soorten betrouwbaarheidsintervallen. Dit zijn de meest gebruikte:
Betrouwbaarheidsinterval voor een gemiddelde
Een betrouwbaarheidsinterval voor een gemiddelde is een reeks waarden die waarschijnlijk een populatiegemiddelde met een bepaald betrouwbaarheidsniveau bevatten. De formule om dit interval te berekenen is als volgt:
Betrouwbaarheidsinterval = x +/- z*(s/√ n )
Goud:
- x : steekproefgemiddelde
- z: de gekozen z-waarde
- s: standaardafwijking van het monster
- n: steekproefomvang
Bronnen:
Hoe u een betrouwbaarheidsinterval voor een gemiddelde kunt berekenen
Betrouwbaarheidsinterval voor een gemiddelde rekenmachine
Betrouwbaarheidsinterval voor verschil tussen gemiddelden
Een betrouwbaarheidsinterval (CI) voor een verschil tussen gemiddelden is een reeks waarden die met een bepaald betrouwbaarheidsniveau waarschijnlijk het werkelijke verschil tussen twee populatiegemiddelden bevat. De formule om dit interval te berekenen is als volgt:
Betrouwbaarheidsinterval = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
Goud:
- x 1 , x 2 : gemiddelde van monster 1, gemiddelde van monster 2
- t: de t-kritische waarde gebaseerd op het betrouwbaarheidsniveau en (n 1 + n 2 -2) vrijheidsgraden
- s p 2 : gepoolde variantie
- n 1 , n 2 : steekproefomvang 1, steekproefomvang 2
Goud:
- De gepoolde variantie wordt als volgt berekend: s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- De t-kritische waarde t kan worden gevonden met behulp van de inverse t-verdelingscalculator.
Bronnen:
Hoe een betrouwbaarheidsinterval voor het verschil tussen gemiddelden te berekenen
Betrouwbaarheidsinterval voor calculator voor verschil tussen middelen
Betrouwbaarheidsinterval voor een deel
Een betrouwbaarheidsinterval voor een aandeel is een reeks waarden die waarschijnlijk een populatieaandeel met een bepaald betrouwbaarheidsniveau zal bevatten. De formule om dit interval te berekenen is als volgt:
Betrouwbaarheidsinterval = p +/- z*(√ p(1-p) / n )
Goud:
- p: steekproefaandeel
- z: de gekozen z-waarde
- n: steekproefomvang
Bronnen:
Hoe u een betrouwbaarheidsinterval voor een aandeel kunt berekenen
Betrouwbaarheidsinterval voor een proportiecalculator
Betrouwbaarheidsinterval voor verschil in verhoudingen
Een betrouwbaarheidsinterval voor het verschil in verhoudingen is een reeks waarden die met een bepaald betrouwbaarheidsniveau waarschijnlijk het werkelijke verschil tussen twee populatieverhoudingen bevat. De formule om dit interval te berekenen is als volgt:
Betrouwbaarheidsinterval = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
Goud:
- p 1 , p 2 : aandeel van monster 1, aandeel van monster 2
- z: de z-kritische waarde gebaseerd op het betrouwbaarheidsniveau
- n 1 , n 2 : steekproefomvang 1, steekproefomvang 2
Bronnen:
Hoe u een betrouwbaarheidsinterval voor het verschil in verhoudingen kunt berekenen
Betrouwbaarheidsinterval voor de calculator voor het verschil in verhoudingen