Welch's t-test: wanneer te gebruiken + voorbeelden
Als we de gemiddelden van twee onafhankelijke groepen willen vergelijken, kunnen we kiezen tussen twee verschillende tests:
Student’s t-test: Bij deze test wordt ervan uitgegaan dat de twee groepen gegevens zijn bemonsterd uit populaties die eennormale verdeling volgen en dat de twee populaties dezelfde variantie hebben.
Welch’s t-test: Deze test gaat ervan uit dat beide groepen gegevens worden bemonsterd uit populaties die een normale verdeling volgen, maar gaat er niet van uit dat deze twee populaties dezelfde variantie hebben .
Het verschil tussen de Student’s t-test en de Welch’s t-test
Er zijn twee verschillen in de manier waarop de Student’s t-test en de Welch’s t-test worden uitgevoerd:
- De teststatistiek
- Graden van vrijheid
Student’s t-toets:
Teststatistiek: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
waarbij x 1 en x 2 de steekproefgemiddelden zijn, n 1 en n 2 de steekproefomvang zijn voor respectievelijk monster 1 en monster 2, en waarbij sp als volgt wordt berekend:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
waarbij s 1 2 en s 2 2 de steekproefvarianties zijn.
Vrijheidsgraden: n 1 + n 2 – 2
Welch’s T-test
Teststatistiek: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Vrijheidsgraden: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
De formule voor het berekenen van de vrijheidsgraden voor de t-test van Welch houdt rekening met het verschil tussen de twee standaarddeviaties. Als de twee steekproeven dezelfde standaardafwijkingen hebben, zullen de vrijheidsgraden van de Welch’s t-test precies hetzelfde zijn als de vrijheidsgraden van de Student’s t-test.
Normaal gesproken zijn de standaarddeviaties voor de twee steekproeven niet hetzelfde en daarom zijn de vrijheidsgraden van de Welch’s t-test doorgaans kleiner dan de vrijheidsgraden van de Student’s t-test.
Het is ook belangrijk op te merken dat de vrijheidsgraden in de t-test van Welch over het algemeen geen geheel getal zijn. Als u handmatig test, kunt u het beste afronden naar het laagste gehele getal. Als u statistische software zoals R gebruikt, kan de software de decimale waarde van de vrijheidsgraden weergeven.
Wanneer moet u de Welch t-test gebruiken?
Sommige mensen beweren dat de t-test van Welch de standaardkeuze zou moeten zijn voor het vergelijken van de gemiddelden van twee onafhankelijke groepen, omdat deze beter presteert dan de Student’s t-test wanneer de steekproefgroottes en varianties tussen groepen ongelijk zijn, en identieke resultaten oplevert wanneer de steekproefomvang zijn verschillend. de verschillen zijn gelijk.
Als je de gemiddelden van twee groepen vergelijkt, is het in de praktijk onwaarschijnlijk dat de standaardafwijkingen van elke groep hetzelfde zullen zijn. Het is dus een goed idee om altijd de t-toets van Welch te gebruiken, zodat u geen aannames hoeft te doen over gelijkheid van varianties.
Voorbeelden van het gebruik van de t-test van Welch
Vervolgens zullen we de t-test van Welch uitvoeren op de volgende twee steekproeven om te bepalen of hun populatiegemiddelden significant verschillen op een significantieniveau van 0,05:
Monster 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Monster 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
We zullen op drie verschillende manieren illustreren hoe u de test kunt uitvoeren:
- Bij de hand
- Gebruik Microsoft Excel
- Gebruik de statistische programmeertaal R
Welch’s T-test met de hand
Om de Welch t-test met de hand uit te voeren, moeten we eerst de steekproefgemiddelden, steekproefvarianties en steekproefomvang vinden:
x1 – 19.27
x2 – 23,69
s 1 2 – 20:42 uur
kunst 2 2 – 83.23
# 1 – 11
# 2 – 13
Vervolgens kunnen we deze cijfers invoeren om de teststatistiek te vinden:
Teststatistiek: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Teststatistiek: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Vrijheidsgraden: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Vrijheidsgraden: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. We ronden dit resultaat af op het dichtstbijzijnde gehele getal, 18 .
Ten slotte vinden we in de t-verdelingstabel de kritische waarde t die overeenkomt met een tweezijdige test met alpha = 0,05 voor 18 vrijheidsgraden:
De kritische waarde t bedraagt 2,101 . Omdat de absolute waarde van onze teststatistiek (1,538) niet groter is dan de kritische waarde t, slagen we er niet in de nulhypothese van de test te verwerpen. Er is niet genoeg bewijs om te zeggen dat de gemiddelden van de twee populaties significant verschillend zijn.
Welch’s T-test met Excel
Om de t-test van Welch in Excel uit te voeren, moeten we eerst de gratis Analysis ToolPak-software downloaden. Als je het nog niet in Excel hebt gedownload, heb ik een korte tutorial geschreven over hoe je het kunt downloaden .
Nadat u Analysis ToolPak hebt gedownload, kunt u de onderstaande stappen volgen om de t-test van Welch uit te voeren op onze twee monsters:
1. Voer de gegevens in. Voer de gegevenswaarden voor de twee monsters in de kolommen A en B in en de kopjes Monster 1 en Monster 2 in de eerste cel van elke kolom.
2. Voer de t-test van Welch uit met behulp van Analysis ToolPak. Ga naar het tabblad Gegevens op het bovenste lint. Klik vervolgens onder de groep Analyse op het pictogram Analysis ToolPak.
Klik in het dialoogvenster dat verschijnt op t-test: twee steekproeven waarbij ongelijke varianties worden aangenomen en klik vervolgens op OK.
Vul ten slotte de onderstaande waarden in en klik vervolgens op OK:
Het volgende resultaat zou moeten verschijnen:
Merk op dat de resultaten van deze test overeenkomen met de resultaten die we handmatig hebben verkregen:
- De teststatistiek is -1,5379 .
- De tweezijdige kritische waarde is 2,1009 .
- Omdat de absolute waarde van de teststatistiek niet groter is dan de tweezijdige kritische waarde, zijn de gemiddelden van de twee populaties niet statistisch verschillend.
- Bovendien is de tweezijdige p-waarde van de test 0,14, wat groter is dan 0,05 en bevestigt dat de gemiddelden van de twee populaties niet statistisch verschillend zijn.
Welch’s t-test met R
De volgende code illustreert hoe u de t-test van Welch kunt uitvoeren voor onze twee voorbeelden met behulp van de statistische programmeertaal R :
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
De functie t.test() geeft de volgende relevante uitvoer weer:
- t: de teststatistiek = -1,5379
- df : vrijheidsgraden = 18,137
- p-waarde: de p-waarde van de tweezijdige toets = 0,1413
- 95% betrouwbaarheidsinterval : het 95% betrouwbaarheidsinterval voor het werkelijke verschil in populatiegemiddelden = (-10,45, 1,61)
De resultaten van deze test komen overeen met de resultaten die handmatig en met behulp van Excel zijn verkregen: het verschil in gemiddelden voor deze twee populaties is niet statistisch significant op het niveau van alfa = 0,05.