Eenzijdige hypothesetoetsing: 3 voorbeeldproblemen
In de statistiek gebruiken we hypothesetoetsen om te bepalen of een uitspraak over een populatieparameter waar is of niet.
Wanneer we een hypothesetest uitvoeren, schrijven we altijd een nulhypothese en een alternatieve hypothese, die de volgende vormen aannemen:
H 0 (nulhypothese): populatieparameter = ≤, ≥ een bepaalde waarde
H A (alternatieve hypothese): populatieparameter <, >, ≠ een bepaalde waarde
Er zijn twee soorten hypothesetoetsen:
- Tweezijdige toets : de alternatieve hypothese bevat het teken ≠
- Eenzijdige test : de alternatieve hypothese bevat het teken < of >
Bij een eenzijdige toets bevat de alternatieve hypothese het teken kleiner dan („<„) of groter dan („>“). Dit geeft aan dat we testen of er sprake is van een positief of negatief effect.
Bekijk de volgende voorbeeldproblemen om eenzijdig testen beter te begrijpen.
Voorbeeld 1: Fabriekswidgets
Stel dat we aannemen dat het gemiddelde gewicht van een bepaald gadget dat in een fabriek wordt geproduceerd 20 gram bedraagt. Een ingenieur is echter van mening dat een nieuwe methode widgets kan produceren die minder dan 20 gram wegen.
Om dit te testen, kan hij een eenzijdige hypothesetest uitvoeren met de volgende nul- en alternatieve hypothesen:
- H 0 (nulhypothese): μ ≥ 20 gram
- HA (alternatieve hypothese): μ < 20 gram
Opmerking : we kunnen zeggen dat dit een eenzijdige toets is, omdat de alternatieve hypothese het kleiner dan-teken ( < ) bevat. Preciezer gezegd zouden we dit een linkse toets noemen, omdat we testen of een populatieparameter kleiner is dan een specifieke waarde.
Om dit te testen gebruikt hij de nieuwe methode om 20 widgets te produceren en krijgt hij de volgende informatie:
- n = 20 widgets
- x = 19,8 gram
- s = 3,1 gram
Als we deze waarden in de one-sample t-test calculator pluggen, krijgen we de volgende resultaten:
- t-teststatistiek: -0,288525
- Eenzijdige p-waarde: 0,388
Omdat de p-waarde niet kleiner is dan 0,05, slaagt de ingenieur er niet in de nulhypothese te verwerpen.
Er is onvoldoende bewijs om te zeggen dat het werkelijke gemiddelde gewicht van de widgets die met de nieuwe methode worden geproduceerd minder dan 20 gram bedraagt.
Voorbeeld 2: Plantengroei
Stel dat is aangetoond dat een standaardmeststof een plantensoort gemiddeld 25 centimeter laat groeien. Eén botanicus gelooft echter dat een nieuwe meststof ervoor kan zorgen dat deze plantensoort gemiddeld meer dan 25 centimeter groeit.
Om dit te testen, kan ze een eenzijdige hypothesetest uitvoeren met de volgende nul- en alternatieve hypothesen:
- H 0 (nulhypothese): μ ≤ 10 inch
- HA (alternatieve hypothese): μ > 10 inch
Opmerking : we kunnen zeggen dat dit een eenzijdige toets is, omdat de alternatieve hypothese het groter dan-teken bevat ( > ). Preciezer gezegd zouden we dit een rechtshandige toets noemen, omdat we testen of een populatieparameter groter is dan een specifieke waarde.
Om deze bewering te testen, past ze de nieuwe meststof toe op een eenvoudige willekeurige steekproef van 15 planten en verkrijgt ze de volgende informatie:
- n = 15 planten
- x = 11,4 inch
- s = 2,5 inch
Als we deze waarden in de one-sample t-test calculator pluggen, krijgen we de volgende resultaten:
- t-teststatistiek: 2,1689
- Eenzijdige p-waarde: 0,0239
Omdat de p-waarde kleiner is dan 0,05, verwerpt de botanicus de nulhypothese.
Ze heeft voldoende bewijs om te concluderen dat de nieuwe meststof een gemiddelde toename van meer dan 25 centimeter veroorzaakt.
Voorbeeld 3: Studiemethode
Een hoogleraar leert studenten momenteel een studiemethode te gebruiken die resulteert in een gemiddelde examenscore van 82. Hij denkt echter dat een nieuwe studiemethode examenscores kan opleveren met een gemiddelde waarde groter dan 82.
Om dit te testen, kan hij een eenzijdige hypothesetest uitvoeren met de volgende nul- en alternatieve hypothesen:
- H 0 (nulhypothese): μ ≤ 82
- HA (alternatieve hypothese): μ > 82
Opmerking : we kunnen zeggen dat dit een eenzijdige toets is, omdat de alternatieve hypothese het groter dan-teken bevat ( > ). Preciezer gezegd zouden we dit een rechtshandige toets noemen, omdat we testen of een populatieparameter groter is dan een specifieke waarde.
Om deze bewering te toetsen vraagt de hoogleraar 25 studenten de nieuwe studiemethode te gebruiken en daarna examen te doen. Het verzamelt de volgende gegevens over de examenresultaten van deze steekproef van studenten:
- n= 25
- x = 85
- s = 4,1
Als we deze waarden in de one-sample t-test calculator pluggen, krijgen we de volgende resultaten:
- t-teststatistiek: 3,6586
- Eenzijdige p-waarde: 0,0006
Omdat de p-waarde kleiner is dan 0,05, verwerpt de professor de nulhypothese.
Hij heeft voldoende bewijs om te concluderen dat de nieuwe studiemethode examenresultaten oplevert met een gemiddelde score boven de 82.
Aanvullende bronnen
De volgende tutorials bieden aanvullende informatie over het testen van hypothesen:
Inleiding tot het testen van hypothesen
Wat is een directionele hypothese?
Wanneer moet je de nulhypothese verwerpen?