Comment trouver la valeur P du coefficient de corrélation dans R



Le coefficient de corrélation de Pearson peut être utilisé pour mesurer l’association linéaire entre deux variables.

Ce coefficient de corrélation prend toujours une valeur comprise entre -1 et 1 où :

  • -1 : Corrélation linéaire parfaitement négative entre deux variables.
  • 0 : Aucune corrélation linéaire entre deux variables.
  • 1 : Corrélation linéaire parfaitement positive entre deux variables.

Pour déterminer si un coefficient de corrélation est statistiquement significatif, vous pouvez calculer le score t et la valeur p correspondants.

La formule pour calculer le t-score d’un coefficient de corrélation (r) est :

t = r√ n-2 / √ 1-r 2

La valeur p est calculée comme la valeur p bilatérale correspondante pour la distribution t avec n-2 degrés de liberté.

Pour calculer la valeur p d’un coefficient de corrélation de Pearson dans R, vous pouvez utiliser la fonction cor.test() .

cor.test(x, y)

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : Calculer la valeur P pour le coefficient de corrélation dans R

Le code suivant montre comment utiliser la fonction cor.test() pour calculer la valeur p du coefficient de corrélation entre deux variables dans R :

#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)

#calculate correlation coefficient and corresponding p-value
cor.test(x, y)

	Pearson's product-moment correlation

data:  x and y
t = -1.7885, df = 8, p-value = 0.1115
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.8709830  0.1434593
sample estimates:
       cor 
-0.5344408

À partir du résultat, nous pouvons voir :

  • Le coefficient de corrélation de Pearson est de -0,5344408 .
  • La valeur p correspondante est de 0,1115 .

Le coefficient de corrélation étant négatif, cela indique qu’il existe une relation linéaire négative entre les deux variables.

Cependant, puisque la valeur p du coefficient de corrélation n’est pas inférieure à 0,05, la corrélation n’est pas statistiquement significative.

Notez que nous pouvons également taper cor.test(x, y)$p.value pour extraire uniquement la valeur p pour le coefficient de corrélation :

#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)

#calculate p-value for correlation between x and y
cor.test(x, y)$p.value

[1] 0.1114995

La valeur p pour le coefficient de corrélation est 0,1114995 .

Cela correspond à la valeur p de la sortie précédente.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment calculer la corrélation partielle dans R
Comment calculer la corrélation de Spearman dans R
Comment calculer la corrélation glissante dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *