Comment calculer la corrélation point-bisériale dans R



La corrélation point-bisériale est utilisée pour mesurer la relation entre une variable binaire, x, et une variable continue, y.

Semblable au coefficient de corrélation de Pearson , le coefficient de corrélation point-bisérial prend une valeur comprise entre -1 et 1 où :

  • -1 indique une corrélation parfaitement négative entre deux variables
  • 0 indique aucune corrélation entre deux variables
  • 1 indique une corrélation parfaitement positive entre deux variables

Ce tutoriel explique comment calculer la corrélation point-bisériale entre deux variables dans R.

Exemple : corrélation point-bisériale dans R

Supposons que nous ayons une variable binaire, x, et une variable continue, y :

x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0)

y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)

Nous pouvons utiliser la fonction R intégrée cor.test() pour calculer la corrélation point-bisériale entre les deux variables :

#calculate point-biserial correlation
cor.test(x, y)

	Pearson's product-moment correlation

data:  x and y
t = 0.67064, df = 9, p-value = 0.5193

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:
 -0.4391885  0.7233704

sample estimates:
      cor 
0.2181635 

À partir du résultat, nous pouvons observer ce qui suit :

  • Le coefficient de corrélation point-bisérial est de 0,218
  • La valeur p correspondante est de 0,5193

Puisque le coefficient de corrélation est positif, cela indique que lorsque la variable x prend la valeur « 1 », la variable y a tendance à prendre des valeurs plus élevées que lorsque la variable x prend la valeur « 0 ».

Cependant, puisque la valeur p de cette corrélation n’est pas inférieure à 0,05, cette corrélation n’est pas statistiquement significative.

Notez que le résultat fournit également un intervalle de confiance de 95 % pour le véritable coefficient de corrélation, qui s’avère être :

IC à 95 % = (-0,439, 0,723)

Puisque cet intervalle de confiance contient zéro, cela constitue une preuve supplémentaire que le coefficient de corrélation n’est pas statistiquement significatif.

Remarque : Vous pouvez trouver la documentation complète de la fonction cor.test() ici .

Ressources additionnelles

Les tutoriels suivants expliquent comment calculer d’autres coefficients de corrélation dans R :

Comment calculer la corrélation partielle dans R
Comment calculer la corrélation glissante dans R
Comment calculer la corrélation de rang de Spearman dans R
Comment calculer la corrélation polychorique dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *