Comment calculer le d de Cohen dans R (avec exemple)
En statistiques, nous utilisons souvent les valeurs p pour déterminer s’il existe une différence statistiquement significative entre la moyenne de deux groupes.
Cependant, même si une valeur p peut nous indiquer s’il existe ou non une différence statistiquement significative entre deux groupes, une taille d’effet peut nous indiquer l’ampleur réelle de cette différence.
L’une des mesures les plus courantes de la taille de l’effet est le d de Cohen , qui est calculé comme suit :
D de Cohen = ( x 1 – x 2 ) / √ (s 1 2 + s 2 2 ) / 2
où:
- x 1 , x 2 : moyenne de l’échantillon 1 et de l’échantillon 2, respectivement
- s 1 2 , s 2 2 : variance de l’échantillon 1 et de l’échantillon 2, respectivement
En utilisant cette formule, voici comment nous interprétons le d de Cohen :
- Un d de 0,5 indique que les moyennes des deux groupes diffèrent de 0,5 écart-type.
- Un d de 1 indique que les moyennes du groupe diffèrent de 1 écart type.
- Un d de 2 indique que les moyennes du groupe diffèrent de 2 écarts types.
Et ainsi de suite.
Voici une autre façon d’interpréter le d de Cohen : une taille d’effet de 0,5 signifie que la valeur de la personne moyenne du groupe 1 est de 0,5 écart-type au-dessus de la personne moyenne du groupe 2.
Nous utilisons souvent la règle empirique suivante pour interpréter le d de Cohen :
- Une valeur de 0,2 représente une petite taille d’effet.
- Une valeur de 0,5 représente une taille d’effet moyenne.
- Une valeur de 0,8 représente une taille d’effet importante.
L’exemple suivant montre comment calculer le d de Cohen dans R.
Exemple : Comment calculer le d de Cohen dans R
Supposons qu’un botaniste applique deux engrais différents aux plantes pour déterminer s’il existe une différence significative dans la croissance moyenne des plantes (en pouces) après un mois.
Il existe deux méthodes que nous pouvons utiliser pour calculer rapidement le d de Cohen dans R :
Méthode 1 : utiliser le package lsr
library(lsr) #define plant growth values for each group group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21) group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23) #calculate Cohen's d cohensD(group1, group2) [1] 0.2635333
Méthode 2 : utiliser le package effsize
library(effsize) #define plant growth values for each group group1 <- c(8, 9, 11, 11, 12, 14, 15, 16, 16, 18, 20, 21) group2 <- c(7, 9, 10, 10, 11, 11, 12, 14, 14, 16, 20, 23) #calculate Cohen's d cohen.d(group1, group2) Cohen's d d estimate: 0.2635333 (small) 95 percent confidence interval: lower upper -0.5867889 1.1138555
Notez que les deux méthodes produisent le même résultat : le d de Cohen est 0,2635 .
Nous interprétons cela comme signifiant que la hauteur moyenne des plantes ayant reçu l’engrais n°1 est supérieure de 0,2635 écart-type à la hauteur moyenne des plantes ayant reçu l’engrais n°2.
En utilisant la règle empirique mentionnée précédemment, nous interpréterions cela comme un effet de petite taille.
En d’autres termes, qu’il existe ou non une différence statistiquement significative dans la croissance moyenne des plantes entre les deux engrais, la différence réelle entre les moyennes des groupes est insignifiante.
Ressources additionnelles
Les didacticiels suivants offrent des informations supplémentaires sur la taille de l’effet et le d de Cohen :
Taille de l’effet : qu’est-ce que c’est et pourquoi c’est important
Comment calculer le d de Cohen dans Excel