Inleiding tot het testen van hypothesen
Een statistische hypothese is een aanname over een populatieparameter .
We kunnen bijvoorbeeld aannemen dat de gemiddelde lengte van een man in de Verenigde Staten 70 inch is.
De hypothese met betrekking tot lengte is de statistische hypothese en de werkelijke gemiddelde lengte van een man in de Verenigde Staten is de populatieparameter .
Een hypothesetest is een formele statistische test die we gebruiken om een statistische hypothese al dan niet te verwerpen.
De twee soorten statistische hypothesen
Om te testen of een statistische hypothese over een populatieparameter waar is, nemen we een willekeurige steekproef uit de populatie en voeren we een hypothesetest uit op de steekproefgegevens.
Er zijn twee soorten statistische hypothesen:
De nulhypothese , ook wel H0 genoemd, is de hypothese dat de steekproefgegevens uitsluitend op toeval berusten.
De alternatieve hypothese , aangeduid als H1 of Ha , is de hypothese dat de steekproefgegevens worden beïnvloed door een niet-willekeurige oorzaak.
Hypothese testen
Een testhypothese omvat vijf stappen:
1. Formuleer de hypothesen.
Geef de nul- en alternatieve hypothesen. Deze twee hypothesen moeten elkaar uitsluiten, dus als de ene waar is, moet de andere onwaar zijn.
2. Bepaal een significantieniveau dat voor de hypothese moet worden gebruikt.
Bepaal een significantieniveau. Veel voorkomende keuzes zijn .01, .05 en .1.
3. Zoek de teststatistiek.
Zoek de teststatistiek en de bijbehorende p-waarde. Vaak analyseren we een populatiegemiddelde of -proportie en de algemene formule voor het vinden van de teststatistiek is: (steekproefstatistiek – populatieparameter) / (standaardafwijking van de statistiek)
4. Verwerp de nulhypothese of verwerp deze niet.
Bepaal met behulp van de teststatistiek of p-waarde of u de nulhypothese wel of niet kunt verwerpen op basis van het significantieniveau.
De p-waarde vertelt ons de kracht van het bewijs dat een nulhypothese ondersteunt. Als de p-waarde kleiner is dan het significantieniveau, verwerpen we de nulhypothese.
5. Interpreteer de resultaten.
Interpreteer de resultaten van de hypothesetest in de context van de gestelde vraag.
De twee soorten beslissingsfouten
Er zijn twee soorten beslissingsfouten die je kunt maken bij het testen van een hypothese:
Type I-fout: je verwerpt de nulhypothese terwijl deze feitelijk waar is. De kans op het begaan van een Type I-fout is gelijk aan het significantieniveau, vaak alpha genoemd, en aangeduid met α.
Type II-fout: u slaagt er niet in de nulhypothese te verwerpen terwijl deze feitelijk onwaar is. De kans op het maken van een Type II-fout wordt testvermogen of bèta genoemd, aangegeven met β.
Unilaterale en bilaterale tests
Een statistische hypothese kan eenzijdig of tweezijdig zijn.
Een eenzijdige hypothese impliceert het maken van een ‘groter dan’- of ‘kleiner dan’-verklaring.
Stel bijvoorbeeld dat de gemiddelde lengte van een man in de Verenigde Staten 70 inch of groter is. De nulhypothese zou H0 zijn: µ ≥ 70 inch en de alternatieve hypothese zou Ha zijn: µ < 70 inch.
Een tweezijdige hypothese omvat het maken van een uitspraak ‘gelijk aan’ of ‘niet gelijk aan’.
Stel bijvoorbeeld dat de gemiddelde lengte van een man in de Verenigde Staten 70 inch is. De nulhypothese zou H0 zijn: µ = 70 inch en de alternatieve hypothese zou Ha zijn: µ ≠ 70 inch.
Opmerking: het teken „is gelijk aan“ is altijd opgenomen in de nulhypothese, ongeacht of dit =, ≥ of ≤ is.
Gerelateerd: Wat is een directionele hypothese?
Soorten hypothesetoetsen
Er zijn veel soorten hypothesetests die u kunt uitvoeren, afhankelijk van het type gegevens waarmee u werkt en het doel van uw analyse.
De volgende tutorials geven uitleg over de meest voorkomende soorten hypothesetoetsen:
Inleiding tot de one-sample t-test
Inleiding tot de t-test met twee steekproeven
Inleiding tot de t-test van gepaarde monsters
Inleiding tot de Z-test met enkele proportie
Inleiding tot de Z-test met twee proporties