Betrouwbaarheidsinterval voor een gemiddelde
Een betrouwbaarheidsinterval voor een gemiddelde is een reeks waarden die waarschijnlijk een populatiegemiddelde met een bepaald betrouwbaarheidsniveau bevatten.
In deze zelfstudie wordt het volgende uitgelegd:
- De motivatie voor het creëren van een betrouwbaarheidsinterval voor een gemiddelde.
- De formule voor het creëren van een betrouwbaarheidsinterval voor een gemiddelde.
- Een voorbeeld van hoe u een betrouwbaarheidsinterval voor een gemiddelde kunt berekenen.
- Hoe een betrouwbaarheidsinterval voor een gemiddelde te interpreteren.
Betrouwbaarheidsinterval voor een gemiddelde: motivatie
De reden dat we zelfs een betrouwbaarheidsinterval voor een gemiddelde willen creëren, is dat we onze onzekerheid willen vastleggen bij het schatten van een populatiegemiddelde.
Laten we bijvoorbeeld zeggen dat we het gemiddelde gewicht van een bepaalde schildpadsoort in Florida willen schatten. Aangezien er duizenden schildpadden in Florida zijn, zou het extreem tijdrovend en duur zijn om elke schildpad afzonderlijk te wegen.
In plaats daarvan zouden we een eenvoudige willekeurige steekproef van 50 schildpadden kunnen nemen en het gemiddelde gewicht van de schildpadden in die steekproef gebruiken om het werkelijke populatiegemiddelde te schatten:
Het probleem is dat het gemiddelde gewicht van de steekproef niet gegarandeerd exact overeenkomt met het gemiddelde gewicht van de gehele populatie. Om deze onzekerheid vast te leggen, kunnen we dus een betrouwbaarheidsinterval creëren dat een reeks waarden bevat die waarschijnlijk het werkelijke gemiddelde gewicht van de schildpadden in de populatie zullen bevatten.
Betrouwbaarheidsinterval voor een gemiddelde: formule
We gebruiken de volgende formule om een betrouwbaarheidsinterval voor een gemiddelde te berekenen:
Betrouwbaarheidsinterval = x +/- z*(s/√ n )
Goud:
- x : steekproefgemiddelde
- z: de gekozen z-waarde
- s: standaardafwijking van het monster
- n: steekproefomvang
De z-waarde die u gebruikt, hangt af van het betrouwbaarheidsniveau dat u kiest. De volgende tabel toont de z-waarde die overeenkomt met de meest voorkomende keuzes op het gebied van het betrouwbaarheidsniveau:
Een niveau van vertrouwen | z-waarde |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2.58 |
Merk op dat hogere betrouwbaarheidsniveaus overeenkomen met grotere z-waarden, wat leidt tot bredere betrouwbaarheidsintervallen. Dit betekent dat bijvoorbeeld een betrouwbaarheidsinterval van 99% breder zal zijn dan een betrouwbaarheidsinterval van 95% voor dezelfde gegevensset.
Betrouwbaarheidsinterval voor een gemiddelde: voorbeeld
Stel dat we een willekeurige steekproef van schildpadden verzamelen met de volgende informatie:
- Steekproefomvang n = 25
- Gemiddeld monstergewicht x = 300
- Steekproefstandaardafwijking s = 18,5
Zo vindt u verschillende betrouwbaarheidsintervallen voor het werkelijke gemiddelde gewicht van de populatie:
90% betrouwbaarheidsinterval: 300 +/- 1,645*(18,5/√ 25 ) = [293,91, 306,09]
95% betrouwbaarheidsinterval: 300 +/- 1,96*(18,5/√ 25 ) = [292,75, 307,25]
99% betrouwbaarheidsinterval: 300 +/- 2,58*(18,5/√ 25 ) = [ 290,47 , 309,53]
Opmerking: u kunt deze betrouwbaarheidsintervallen ook vinden met behulp van de Statistical Confidence Interval Calculator .
Betrouwbaarheidsinterval voor een gemiddelde: interpretatie
De manier waarop we een betrouwbaarheidsinterval zouden interpreteren is:
Er is een kans van 95% dat het betrouwbaarheidsinterval van [292,75, 307,25] het werkelijke gemiddelde gewicht van de schildpadpopulatie bevat.
Een andere manier om hetzelfde te zeggen is dat er slechts een kans van 5% is dat het werkelijke populatiegemiddelde buiten het betrouwbaarheidsinterval van 95% ligt. Dat wil zeggen, er is slechts een kans van 5% dat het werkelijke gemiddelde gewicht van de schildpadpopulatie groter zal zijn dan 307,25 pond of minder dan 292,75 pond.