Comment calculer la corrélation point-bisériale dans R
La corrélation point-bisériale est utilisée pour mesurer la relation entre une variable binaire, x, et une variable continue, y.
Semblable au coefficient de corrélation de Pearson , le coefficient de corrélation point-bisérial prend une valeur comprise entre -1 et 1 où :
- -1 indique une corrélation parfaitement négative entre deux variables
- 0 indique aucune corrélation entre deux variables
- 1 indique une corrélation parfaitement positive entre deux variables
Ce tutoriel explique comment calculer la corrélation point-bisériale entre deux variables dans R.
Exemple : corrélation point-bisériale dans R
Supposons que nous ayons une variable binaire, x, et une variable continue, y :
x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0) y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)
Nous pouvons utiliser la fonction R intégrée cor.test() pour calculer la corrélation point-bisériale entre les deux variables :
#calculate point-biserial correlation
cor.test(x, y)
Pearson's product-moment correlation
data: x and y
t = 0.67064, df = 9, p-value = 0.5193
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.4391885 0.7233704
sample estimates:
cor
0.2181635
À partir du résultat, nous pouvons observer ce qui suit :
- Le coefficient de corrélation point-bisérial est de 0,218
- La valeur p correspondante est de 0,5193
Puisque le coefficient de corrélation est positif, cela indique que lorsque la variable x prend la valeur « 1 », la variable y a tendance à prendre des valeurs plus élevées que lorsque la variable x prend la valeur « 0 ».
Cependant, puisque la valeur p de cette corrélation n’est pas inférieure à 0,05, cette corrélation n’est pas statistiquement significative.
Notez que le résultat fournit également un intervalle de confiance de 95 % pour le véritable coefficient de corrélation, qui s’avère être :
IC à 95 % = (-0,439, 0,723)
Puisque cet intervalle de confiance contient zéro, cela constitue une preuve supplémentaire que le coefficient de corrélation n’est pas statistiquement significatif.
Remarque : Vous pouvez trouver la documentation complète de la fonction cor.test() ici .
Ressources additionnelles
Les tutoriels suivants expliquent comment calculer d’autres coefficients de corrélation dans R :
Comment calculer la corrélation partielle dans R
Comment calculer la corrélation glissante dans R
Comment calculer la corrélation de rang de Spearman dans R
Comment calculer la corrélation polychorique dans R