Chikwadraattest en t-test: wat is het verschil?
Chi-kwadraattoetsen en t-toetsen zijn twee van de meest voorkomende typen statistische toetsen. Het is dus belangrijk om het verschil tussen deze twee tests te begrijpen en te weten wanneer u ze moet gebruiken, afhankelijk van het probleem dat u wilt beantwoorden.
Deze tutorial biedt een eenvoudige uitleg van het verschil tussen de twee tests, en ook wanneer u ze moet gebruiken.
chikwadraattoets
Er zijn eigenlijk verschillende versies van de chikwadraattoets, maar de meest voorkomende is de chikwadraattoets van onafhankelijkheid .
Definitie
We gebruiken een chikwadraattoets voor onafhankelijkheid als we formeel willen testen of er al dan niet een statistisch significant verband bestaat tussen twee categorische variabelen.
De testhypotheses zijn als volgt:
Nulhypothese (H 0 ): Er is geen significant verband tussen de twee variabelen.
Alternatieve hypothese: (Ha): Er is een significant verband tussen de twee variabelen.
Voorbeelden
Hier zijn enkele voorbeelden van wanneer we een chikwadraattoets voor onafhankelijkheid kunnen gebruiken:
Voorbeeld 1: We willen weten of er een statistisch significant verband bestaat tussen geslacht (man, vrouw) en politieke partijvoorkeur (Republikeins, Democratisch, Onafhankelijk). Om dit te testen, kunnen we 100 willekeurige mensen ondervragen en hun voorkeur voor geslacht en politieke partij vastleggen. Vervolgens kunnen we een chikwadraattoets uitvoeren om te bepalen of er een statistisch significant verband bestaat tussen geslacht en politieke partijvoorkeur.
Voorbeeld 2: We willen weten of er een statistisch significant verband bestaat tussen het niveau van de klas (eerstejaars, tweedejaars, junior, senior) en favoriete filmgenre (thriller, drama, western). Om dit te testen, kunnen we 100 willekeurige leerlingen van elk leerjaar op een bepaalde school ondervragen en hun favoriete filmgenre vastleggen. Vervolgens kunnen we een chi-kwadraattest van onafhankelijkheid uitvoeren om te bepalen of er een statistisch significant verband bestaat tussen het niveau van de film en het favoriete filmgenre.
Voorbeeld 3: We willen weten of er een statistisch significant verband bestaat tussen iemands favoriete sport (basketbal, honkbal, voetbal) en waar hij is opgegroeid (stad, platteland). Om dit te testen, zouden we 100 willekeurige mensen kunnen ondervragen en hen vragen in wat voor soort plaats ze zijn opgegroeid en wat hun favoriete sport is. Vervolgens kunnen we een chikwadraattest uitvoeren om te bepalen of er een statistisch significant verband bestaat tussen iemands favoriete sport en waar hij of zij is opgegroeid.
Hypotheses
Voordat we een chikwadraattoets voor onafhankelijkheid kunnen uitvoeren, moeten we er eerst voor zorgen dat aan de volgende aannames wordt voldaan om de geldigheid van onze toets te garanderen:
- Willekeurig: Er moet een willekeurige steekproef of willekeurig experiment worden gebruikt om gegevens uit beide monsters te verzamelen.
- Categorisch: De variabelen die we bestuderen moeten categorisch zijn.
- Grootte: het verwachte aantal waarnemingen op elk niveau van de variabele moet minimaal 5 zijn.
Als deze aannames worden geverifieerd, kunnen we de test uitvoeren.
t-test
Er zijn ook een paar verschillende versies van de t-toets, maar de meest voorkomende is de t-toets voor verschil in gemiddelden .
Definitie
We gebruiken een t-toets voor een verschil in gemiddelden als we formeel willen testen of er al dan niet een statistisch significant verschil bestaat tussen twee populatiegemiddelden.
De testhypotheses zijn als volgt:
Nulhypothese (H 0 ): De gemiddelden van de twee populaties zijn gelijk.
Alternatieve hypothese: (Ha): De gemiddelden van de twee populaties zijn niet gelijk.
Opmerking: Het is mogelijk om te testen of het ene populatiegemiddelde hoger of lager is dan het andere, maar de meest voorkomende nulhypothese is dat de twee gemiddelden gelijk zijn.
Voorbeelden
Hier zijn enkele voorbeelden van wanneer we een t-toets kunnen gebruiken voor een verschil in gemiddelden:
Voorbeeld 1: We willen weten of dieet A of dieet B tot meer gewichtsverlies leidt. We wijzen willekeurig 100 mensen toe om dieet A gedurende twee maanden te volgen en nog eens 100 mensen om dieet B gedurende twee maanden te volgen. We kunnen een t-test uitvoeren om te bepalen of er een statistisch significant verschil is in het gemiddelde gewichtsverlies tussen de twee groepen.
Voorbeeld 2: We willen weten of twee verschillende studieplannen leiden tot verschillende examenresultaten voor studenten. We wijzen willekeurig 50 studenten toe om één studieplan te gebruiken en 50 studenten om een ander studieplan te gebruiken gedurende een maand voorafgaand aan een examen. We kunnen een t-test uitvoeren om een verschil in middelen te bepalen om te bepalen of er een statistisch significant verschil is in de gemiddelde examenscores tussen de twee studieplannen.
Voorbeeld 3: We willen weten of leerlingen op twee verschillende scholen dezelfde gemiddelde lengte hebben. We meten de lengte van 100 willekeurige leerlingen van de ene school en 100 willekeurige leerlingen van een andere school. We kunnen een t-test uitvoeren voor een verschil in gemiddelden om te bepalen of er een statistisch significant verschil is in de gemiddelde leerlinglengte tussen de twee scholen.
Hypotheses
Voordat we een hypothesetest kunnen uitvoeren op een verschil tussen twee populatiegemiddelden, moeten we er eerst voor zorgen dat aan de volgende voorwaarden is voldaan om de geldigheid van onze hypothesetest te garanderen:
- Willekeurig: Er moet een willekeurige steekproef of willekeurig experiment worden gebruikt om gegevens voor beide monsters te verzamelen.
- Normaal: De steekproefverdeling is normaal of ongeveer normaal.
- Onafhankelijkheid: De twee steekproeven zijn onafhankelijk.
Als aan deze aannames wordt voldaan, kunnen we de hypothesetest uitvoeren.
Hoe u weet wanneer u elke test moet gebruiken
Hier is een korte samenvatting van elke test:
Chikwadraattest voor onafhankelijkheid: Hiermee kunt u testen of er al dan niet een statistisch significant verband bestaat tussen twee categorische variabelen. Wanneer u de nulhypothese van een chikwadraattoets voor onafhankelijkheid verwerpt, betekent dit dat er een significant verband bestaat tussen de twee variabelen.
T-Test voor verschil in gemiddelden: Hiermee kunt u testen of er al dan niet een statistisch significant verschil bestaat tussen twee populatiegemiddelden. Wanneer je de nulhypothese van een t-toets voor een verschil in gemiddelden verwerpt, betekent dit dat de gemiddelden van de twee populaties niet gelijk zijn.
De eenvoudigste manier om te weten of je wel of niet een chikwadraattoets moet gebruiken in plaats van een t-toets, is door simpelweg te kijken naar de soorten variabelen waarmee je werkt.
Als u twee variabelen heeft die beide categorisch zijn, dat wil zeggen dat ze in categorieën kunnen worden geplaatst, zoals mannelijk , vrouwelijk , en Republikeins , Democratisch , onafhankelijk , dan moet u een chikwadraattoets gebruiken.
Maar als de ene variabelecategorisch is (bijvoorbeeld het type studieplan – plan 1 of plan 2) en de andere continu is (bijvoorbeeld de examenscore – gemeten van 0 tot 100), dan moet je een t-toets gebruiken.