De satterthwaite-benadering: definitie en voorbeeld
De Satterthwaite-benadering is een formule die wordt gebruikt om de „effectieve vrijheidsgraden“ te vinden in een t-test met twee steekproeven.
Het wordt het vaakst gebruikt in de Welch’s t-test , die de gemiddelden van twee onafhankelijke steekproeven vergelijkt zonder aan te nemen dat de populaties waaruit de steekproeven zijn getrokken gelijke varianties hebben.
De formule voor de Satterthwaite-benadering is als volgt:
Degrees of freedom: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]}
Goud:
- s 1 2 , s 2 2 : De steekproefvariantie van respectievelijk de eerste en tweede steekproeven.
- n1 , n2 : De steekproefomvang van respectievelijk de eerste en tweede monsters.
Het volgende voorbeeld laat zien hoe u de Satterthwaite-benadering gebruikt om de effectieve vrijheidsgraden te berekenen.
Voorbeeld: Berekening van de Satterthwaite-benadering
Stel dat we willen weten of de gemiddelde hoogte van twee verschillende plantensoorten gelijk is. We nemen dus twee eenvoudige willekeurige monsters van elke soort en meten de hoogte van de planten in elk monster.
De volgende waarden geven de hoogte (in inches) van elk monster aan:
Monster 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Monster 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
De gemiddelden, varianties en steekproefgroottes blijken als volgt te zijn:
- x1 = 19,27
- x2 = 23,69
- s 1 2 = 20,42
- s2 2 = 83,23
- n1 = 11
- n2 = 13
Vervolgens kunnen we de waarden van de varianties en steekproefgroottes in de Satterthwaite-benaderingsformule pluggen om de effectieve vrijheidsgraden te vinden:
df = (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 / (n 2 – 1)]}
df = (20.42/11 + 83.23/13) 2 /{[(20.42/11) 2 /(11 – 1)] + [(83.23/13) 2 /(13 – 1)]} = 18.137
De effectieve vrijheidsgraden blijken 18.137 te zijn.
Normaal gesproken ronden we deze waarde af op het dichtstbijzijnde gehele getal, dus de vrijheidsgraden die we zouden gebruiken in onze Welch’s t-test zijn 18 .
Ten slotte vinden we in de t-verdelingstabel de kritische waarde t die overeenkomt met een tweezijdige toets met alpha = 0,05 voor 18 vrijheidsgraden:
De kritische waarde t bedraagt 2,101 .
We zouden dan onze teststatistiek als volgt berekenen:
Teststatistiek: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Teststatistiek: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Omdat de absolute waarde van onze teststatistiek (1,538) niet groter is dan de kritische waarde t, slagen we er niet in de nulhypothese van de test te verwerpen.
Er is niet genoeg bewijs om te zeggen dat de gemiddelden van de twee populaties significant verschillend zijn.
De Satterthwaite-benadering in de praktijk
In de praktijk zult u de Satterthwaite-benadering zelden handmatig hoeven te berekenen.
In plaats daarvan kunnen gangbare statistische software zoals R, Python, Excel, SAS en Stata allemaal de Satterthwaite-benadering gebruiken om automatisch de effectieve vrijheidsgraden voor u te berekenen.
Aanvullende bronnen
Inleiding tot het testen van hypothesen
Een inleiding tot de t-toets met twee steekproeven
Een inleiding tot de Welch t-test