Hypothesetesten en betrouwbaarheidsinterval: wat is het verschil?
Twee van de meest gebruikte procedures in de statistiek zijn het testen van hypothesen en betrouwbaarheidsintervallen .
Hier is het verschil tussen de twee:
- Een hypothesetest is een formele statistische test die wordt gebruikt om te bepalen of een hypothese over een populatieparameter waar is.
- Een betrouwbaarheidsinterval is een reeks waarden die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevatten.
Deze tutorial geeft een kort overzicht van elke methode, samen met hun overeenkomsten en verschillen.
De basisprincipes van het testen van hypothesen
Een testhypothese wordt gebruikt om te testen of een hypothese over een populatieparameter al dan niet waar is.
Om hypothesetests in de echte wereld uit te voeren, zullen onderzoekers een willekeurige steekproef van de populatie nemen en een hypothesetest uitvoeren op de steekproefgegevens, waarbij ze een nul- en alternatieve hypothese gebruiken:
- Nulhypothese (H 0 ): De steekproefgegevens zijn uitsluitend gebaseerd op toeval.
- Alternatieve hypothese ( HA ): de steekproefgegevens worden beïnvloed door een niet-willekeurige oorzaak.
Als de p-waarde van de hypothesetest onder een bepaald significantieniveau ligt (bijvoorbeeld α = 0,05), kunnen we de nulhypothese verwerpen en concluderen dat we voldoende bewijs hebben om te stellen dat de alternatieve hypothese waar is.
Hypothesetestvoorbeeld
Stel dat een fabriek wil testen of een nieuwe methode het aantal defecte widgets dat per maand wordt geproduceerd, dat momenteel 250 bedraagt, al dan niet verandert.
Om dit te testen, kunnen ze het gemiddelde aantal defecte widgets meten dat is geproduceerd voor en na het gebruik van de nieuwe methode gedurende een maand.
Ze kunnen een hypothesetest uitvoeren met behulp van de volgende hypothesen:
- H 0 : μ na = μ ervoor (het gemiddelde aantal defecte widgets is hetzelfde voor en na gebruik van de nieuwe methode)
- H A : μ na ≠ μ ervoor (het gemiddelde aantal geproduceerde defecte widgets is verschillend voor en na gebruik van de nieuwe methode)
Laten we zeggen dat ze een t-test met één steekproef uitvoeren en een p-waarde van 0,0032 krijgen.
Omdat deze p-waarde kleiner is dan α = 0,05, kan de faciliteit de nulhypothese verwerpen en concluderen dat de nieuwe methode resulteert in een verandering in het aantal defecte widgets dat per maand wordt geproduceerd.
De basisprincipes van betrouwbaarheidsintervallen
Een betrouwbaarheidsinterval is een reeks waarden die waarschijnlijk een populatieparameter met een bepaald betrouwbaarheidsniveau bevatten.
Om een betrouwbaarheidsinterval in de echte wereld te berekenen, nemen onderzoekers een willekeurige steekproef uit de populatie en gebruiken ze de volgende formule om een betrouwbaarheidsinterval voor het populatiegemiddelde te berekenen:
Betrouwbaarheidsinterval = x +/- z*(s/√ n )
Goud:
- x : steekproefgemiddelden
- z: de gekozen z-waarde
- s: standaardafwijking van het monster
- n: steekproefomvang
De z-waarde die u gebruikt, hangt af van het betrouwbaarheidsniveau dat u kiest. De volgende tabel toont de z-waarde die overeenkomt met de meest voorkomende keuzes op het gebied van het betrouwbaarheidsniveau:
Een niveau van vertrouwen | z-waarde |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2.58 |
Voorbeeld van een betrouwbaarheidsinterval
Stel dat een bioloog het gemiddelde gewicht van schildpadden in een bepaalde populatie wil schatten en zij verzamelt een willekeurige steekproef van schildpadden met de volgende informatie:
- Steekproefomvang n = 25
- Gemiddeld monstergewicht x = 300
- Steekproefstandaardafwijking s = 18,5
Zo berekent u het 90% betrouwbaarheidsinterval voor het werkelijke populatiegemiddelde gewicht:
90% betrouwbaarheidsinterval: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
De bioloog kan er 90% zeker van zijn dat het werkelijke gemiddelde gewicht van een schildpad in deze populatie tussen de 293,1 pond en 306,09 pond ligt.
Hypothesetesten versus betrouwbaarheidsinterval: wanneer moet u ze gebruiken?
De beslissing om een hypothesetest of een betrouwbaarheidsinterval te gebruiken, hangt af van de vraag die u probeert te beantwoorden.
U moet een betrouwbaarheidsinterval gebruiken als u de waarde van een populatieparameter wilt schatten.
U moet hypothesetoetsen gebruiken als u wilt bepalen of een hypothese over een populatieparameter waarschijnlijk waar is.
Overweeg de volgende scenario’s om uw kennis over het gebruik van elke procedure te testen.
Scenario 1: Uren besteed aan studeren
Stel dat een universitair onderzoeker het gemiddelde aantal uren dat studenten per week aan studeren wil meten.
Welke procedure moet ze gebruiken om deze vraag te beantwoorden?
Ze moet een betrouwbaarheidsinterval gebruiken omdat ze de waarde van een populatieparameter wil schatten.
Scenario 2: Nieuw medicijn
Stel dat een arts wil testen of een nieuw medicijn de bloeddruk meer kan verlagen dan het huidige standaardmedicijn.
Welke procedure moet hij gebruiken om deze vraag te beantwoorden?
Hij moet hypothesetoetsen gebruiken omdat hij wil begrijpen of een specifieke hypothese met betrekking tot een populatieparameter waar is of niet.
Aanvullende bronnen
De volgende tutorials bieden aanvullende informatie over het testen van hypothesen :
Inleiding tot het testen van hypothesen
Inleiding tot de one-sample t-test
Inleiding tot de t-test met twee steekproeven
Inleiding tot de t-test van gepaarde monsters
De volgende zelfstudies bieden aanvullende informatie over betrouwbaarheidsintervallen :
Inleiding tot betrouwbaarheidsintervallen
Betrouwbaarheidsinterval voor een gemiddelde
Betrouwbaarheidsinterval voor een deel