Comment trouver la valeur P du coefficient de corrélation dans R
Le coefficient de corrélation de Pearson peut être utilisé pour mesurer l’association linéaire entre deux variables.
Ce coefficient de corrélation prend toujours une valeur comprise entre -1 et 1 où :
- -1 : Corrélation linéaire parfaitement négative entre deux variables.
- 0 : Aucune corrélation linéaire entre deux variables.
- 1 : Corrélation linéaire parfaitement positive entre deux variables.
Pour déterminer si un coefficient de corrélation est statistiquement significatif, vous pouvez calculer le score t et la valeur p correspondants.
La formule pour calculer le t-score d’un coefficient de corrélation (r) est :
t = r√ n-2 / √ 1-r 2
La valeur p est calculée comme la valeur p bilatérale correspondante pour la distribution t avec n-2 degrés de liberté.
Pour calculer la valeur p d’un coefficient de corrélation de Pearson dans R, vous pouvez utiliser la fonction cor.test() .
cor.test(x, y)
L’exemple suivant montre comment utiliser cette fonction dans la pratique.
Exemple : Calculer la valeur P pour le coefficient de corrélation dans R
Le code suivant montre comment utiliser la fonction cor.test() pour calculer la valeur p du coefficient de corrélation entre deux variables dans R :
#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)
#calculate correlation coefficient and corresponding p-value
cor.test(x, y)
Pearson's product-moment correlation
data: x and y
t = -1.7885, df = 8, p-value = 0.1115
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.8709830 0.1434593
sample estimates:
cor
-0.5344408
À partir du résultat, nous pouvons voir :
- Le coefficient de corrélation de Pearson est de -0,5344408 .
- La valeur p correspondante est de 0,1115 .
Le coefficient de corrélation étant négatif, cela indique qu’il existe une relation linéaire négative entre les deux variables.
Cependant, puisque la valeur p du coefficient de corrélation n’est pas inférieure à 0,05, la corrélation n’est pas statistiquement significative.
Notez que nous pouvons également taper cor.test(x, y)$p.value pour extraire uniquement la valeur p pour le coefficient de corrélation :
#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)
#calculate p-value for correlation between x and y
cor.test(x, y)$p.value
[1] 0.1114995
La valeur p pour le coefficient de corrélation est 0,1114995 .
Cela correspond à la valeur p de la sortie précédente.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment calculer la corrélation partielle dans R
Comment calculer la corrélation de Spearman dans R
Comment calculer la corrélation glissante dans R