T-test met twee steekproeven: definitie, formule en voorbeeld
Een t-test met twee steekproeven wordt gebruikt om te bepalen of de gemiddelden van twee populaties al dan niet gelijk zijn.
In deze zelfstudie wordt het volgende uitgelegd:
- De motivatie voor het uitvoeren van een t-test met twee steekproeven.
- De formule voor het uitvoeren van een t-toets met twee steekproeven.
- De aannames waaraan moet worden voldaan om een t-test met twee steekproeven uit te voeren.
- Een voorbeeld van hoe u een t-test met twee steekproeven uitvoert.
T-test met twee steekproeven: motivatie
Stel dat we willen weten of het gemiddelde gewicht van twee verschillende soorten schildpadden gelijk is of niet. Omdat er in elke populatie duizenden schildpadden zijn, zou het te tijdrovend en te duur zijn om elke schildpad afzonderlijk te wegen.
In plaats daarvan zouden we een eenvoudige willekeurige steekproef van 15 schildpadden uit elke populatie kunnen nemen en het gemiddelde gewicht van elke steekproef kunnen gebruiken om te bepalen of het gemiddelde gewicht gelijk is tussen de twee populaties:
Het is echter vrijwel gegarandeerd dat het gemiddelde gewicht tussen de twee monsters op zijn minst enigszins zal verschillen. De vraag is of dit verschil statistisch significant is . Gelukkig kunnen we deze vraag met een t-test met twee steekproeven beantwoorden.
T-test met twee steekproeven: formule
Een t-test met twee steekproeven gebruikt altijd de volgende nulhypothese:
- H 0 : μ 1 = μ 2 (de twee populatiegemiddelden zijn gelijk)
De alternatieve hypothese kan bilateraal, links of rechts zijn:
- H 1 (tweezijdig): μ 1 ≠ μ 2 (de gemiddelden van de twee populaties zijn niet gelijk)
- H 1 (links): μ 1 < μ 2 (het gemiddelde van populatie 1 is lager dan het gemiddelde van populatie 2)
- H 1 (rechts): μ 1 > μ 2 (het gemiddelde van populatie 1 is groter dan het gemiddelde van populatie 2)
We gebruiken de volgende formule om de t-teststatistiek te berekenen:
Teststatistiek: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
waarbij x 1 en x 2 de steekproefgemiddelden zijn, n 1 en n 2 de steekproefomvang zijn, en waarbij sp als volgt wordt berekend:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
waarbij s 1 2 en s 2 2 de steekproefvarianties zijn.
Als de p-waarde die overeenkomt met de t-toetsstatistiek met (n 1 + n 2 -1) vrijheidsgraden kleiner is dan het significantieniveau dat u kiest (veel voorkomende keuzes zijn 0,10, 0,05 en 0, 01), dan kan de nulhypothese verwerpen. .
T-test met twee steekproeven: hypothesen
Om de resultaten van een t-test met twee steekproeven geldig te laten zijn, moet aan de volgende aannames worden voldaan:
- De waarnemingen van het ene monster moeten onafhankelijk zijn van de waarnemingen van het andere monster.
- De gegevens moeten ongeveer normaal verdeeld zijn.
- De twee monsters moeten ongeveer dezelfde variantie hebben. Als niet aan deze veronderstelling wordt voldaan, moet u in plaats daarvan de Welch’s t-test uitvoeren.
- Gegevens van beide monsters zijn verkregen met behulp van een willekeurige steekproefmethode .
T-test met twee steekproeven : voorbeeld
Stel dat we willen weten of het gemiddelde gewicht van twee verschillende soorten schildpadden gelijk is of niet. Om dit te testen, zullen we een t-test met twee steekproeven uitvoeren op het significantieniveau α = 0,05 met behulp van de volgende stappen:
Stap 1: Verzamel voorbeeldgegevens.
Stel dat we uit elke populatie een willekeurige steekproef van schildpadden verzamelen met de volgende informatie:
Voorbeeld 1:
- Steekproefomvang n 1 = 40
- Gemiddeld monstergewicht x 1 = 300
- Steekproefstandaardafwijking s 1 = 18,5
Voorbeeld 2:
- Steekproefomvang n 2 = 38
- Gemiddeld monstergewicht x 2 = 305
- Steekproefstandaardafwijking s 2 = 16,7
Stap 2: Definieer aannames.
We zullen de t-test met twee steekproeven uitvoeren met de volgende aannames:
- H 0 : μ 1 = μ 2 (de twee populatiegemiddelden zijn gelijk)
- H 1 : μ 1 ≠ μ 2 (de twee populatiegemiddelden zijn niet gelijk)
Stap 3: Bereken de t -teststatistiek.
Eerst berekenen we de gepoolde standaardafwijking sp :
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2) = √ ( 40-1)18,5 2 + (38-1) 16,7 2 / (40+38-2) = 17,647
Vervolgens zullen we de t -teststatistiek berekenen:
t = ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 ) = (300-305) / 17,647(√ 1/40 + 1/38 ) = -1,2508
Stap 4: Bereken de p-waarde van de t- teststatistiek.
Volgens de T Score to P Value Calculator is de p-waarde geassocieerd met t = -1,2508 en vrijheidsgraden = n 1 + n 2 -2 = 40+38-2 = 76 0,21484 .
Stap 5: Trek een conclusie.
Omdat deze p-waarde niet lager is dan ons significantieniveau α = 0,05, slagen we er niet in de nulhypothese te verwerpen. We hebben niet voldoende bewijs om te zeggen dat het gemiddelde gewicht van schildpadden tussen deze twee populaties verschillend is.
Opmerking: u kunt deze volledige t-toets met twee steekproeven ook uitvoeren door eenvoudigweg de t-toetscalculator met twee steekproeven te gebruiken.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u een t-test met twee steekproeven uitvoert met behulp van verschillende statistische programma’s:
Hoe u een t-test met twee steekproeven uitvoert in Excel
Hoe u een t-test met twee steekproeven uitvoert in SPSS
Hoe u een t-test met twee steekproeven uitvoert in Stata
Hoe voer je een t-test met twee steekproeven uit in R
Hoe u een t-test met twee steekproeven uitvoert in Python
Hoe u een t-test met twee steekproeven uitvoert op een TI-84-rekenmachine