Hoe cohen's d in r te berekenen (met voorbeeld)
In de statistiek gebruiken we vaak p-waarden om te bepalen of er een statistisch significant verschil bestaat tussen het gemiddelde van twee groepen.
Hoewel een p-waarde ons echter kan vertellen of er al dan niet een statistisch significant verschil is tussen twee groepen, kan een effectgrootte ons vertellen hoe groot dat verschil werkelijk is.
Een van de meest gebruikelijke maatstaven voor de effectgrootte is Cohen’s d , die als volgt wordt berekend:
Cohen’s D = ( x1 – x2 ) / √ ( s12 + s22 ) / 2
Goud:
- x 1 , x 2 : gemiddelde van respectievelijk monster 1 en monster 2
- s 1 2 , s 2 2 : variantie van respectievelijk monster 1 en monster 2
Met behulp van deze formule interpreteren we Cohen’s d als volgt:
- Een d van 0,5 geeft aan dat de gemiddelden van de twee groepen 0,5 standaarddeviaties verschillen.
- Een d van 1 geeft aan dat de groepsgemiddelden 1 standaarddeviatie verschillen.
- Een d van 2 geeft aan dat de groepsgemiddelden twee standaarddeviaties verschillen.
Enzovoort.
Hier is een andere manier om Cohen’s d te interpreteren: een effectgrootte van 0,5 betekent dat de waarde van de gemiddelde persoon in groep 1 0,5 standaardafwijkingen boven de gemiddelde persoon in groep 2 ligt.
We gebruiken vaak de volgende vuistregel om Cohen’s d te interpreteren:
- Een waarde van 0,2 vertegenwoordigt een kleine effectgrootte.
- Een waarde van 0,5 vertegenwoordigt een gemiddelde effectgrootte.
- Een waarde van 0,8 vertegenwoordigt een grote effectgrootte.
Het volgende voorbeeld laat zien hoe je Cohen’s d in R berekent.
Voorbeeld: Hoe Cohen’s d in R te berekenen
Stel dat een botanicus twee verschillende meststoffen op planten toepast om te bepalen of er na een maand een significant verschil is in de gemiddelde plantengroei (in inches).
Er zijn twee methoden die we kunnen gebruiken om Cohen’s d in R snel te berekenen:
Methode 1: Gebruik het lsr-pakket
library (lsr) #define plant growth values for each group group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21) group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23) #calculate Cohen's d cohensD(group1, group2) [1] 0.2635333
Methode 2: Gebruik het effsize-pakket
library (effsize) #define plant growth values for each group group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21) group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23) #calculate Cohen's d cohen.d(group1, group2) Cohen's d d estimate: 0.2635333 (small) 95 percent confidence interval: lower upper -0.5867889 1.1138555
Merk op dat beide methoden hetzelfde resultaat opleveren: Cohen’s d is 0,2635 .
We interpreteren dit zo dat de gemiddelde hoogte van planten die kunstmest nr. 1 hebben gekregen 0,2635 standaarddeviaties groter is dan de gemiddelde hoogte van planten die kunstmest nr. 2 hebben gekregen.
Gebruikmakend van de eerder genoemde vuistregel, zouden we dit interpreteren als een kleine effectgrootte.
Met andere woorden: ongeacht of er wel of niet een statistisch significant verschil bestaat in de gemiddelde plantengroei tussen de twee meststoffen, is het werkelijke verschil tussen de groepsgemiddelden onbeduidend.
Aanvullende bronnen
De volgende tutorials bieden aanvullende informatie over effectgrootte en Cohen’s d:
Effectgrootte: wat het is en waarom het ertoe doet
Hoe Cohen’s d in Excel te berekenen