Comment calculer la corrélation de rang de Spearman dans R



En statistique, la corrélation fait référence à la force et à la direction d’une relation entre deux variables. La valeur d’un coefficient de corrélation peut aller de -1 à 1, avec les interprétations suivantes :

  • -1 : une relation négative parfaite entre deux variables
  • 0 : aucune relation entre deux variables
  • 1 : une relation positive parfaite entre deux variables

Un type spécial de corrélation est appelé corrélation de rang de Spearman , qui est utilisé pour mesurer la corrélation entre deux variables classées. (par exemple, le rang de la note à l’examen de mathématiques d’un élève par rapport au rang de sa note à l’examen de sciences dans une classe).

Pour calculer la corrélation de rang de Spearman entre deux variables dans R, nous pouvons utiliser la syntaxe de base suivante :

corr <- cor.test(x, y, method = 'spearman')

Les exemples suivants montrent comment utiliser cette fonction dans la pratique.

Exemple 1 : Corrélation des rangs de Spearman entre les vecteurs

Le code suivant montre comment calculer la corrélation de rang de Spearman entre deux vecteurs dans R :

#define data
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)

#calculate Spearman rank correlation between x and y
cor.test(x, y, method = 'spearman')

	Spearman's rank correlation rho

data:  x and y
S = 234, p-value = 0.2324
alternative hypothesis: true rho is not equal to 0
sample estimates:
       rho 
-0.4181818 

À partir du résultat, nous pouvons voir que la corrélation des rangs de Spearman est de -0,41818 et que la valeur p correspondante est de 0,2324 .

Cela indique qu’il existe une corrélation négative entre les deux vecteurs.

Cependant, puisque la valeur p de la corrélation n’est pas inférieure à 0,05, la corrélation n’est pas statistiquement significative.

Exemple 2 : Corrélation du classement Spearman entre les colonnes du bloc de données

Le code suivant montre comment calculer la corrélation de rang de Spearman entre deux colonnes dans un bloc de données :

#define data frame
df <- data.frame(team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'),
                 points=c(67, 70, 75, 78, 73, 89, 84, 99, 90, 91),
                 assists=c(22, 27, 30, 23, 25, 31, 38, 35, 34, 32))

#calculate Spearman rank correlation between x and y
cor.test(df$points, df$assists, method = 'spearman')

	Spearman's rank correlation rho

data:  df$points and df$assists
S = 36, p-value = 0.01165
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.7818182 

À partir du résultat, nous pouvons voir que la corrélation des rangs de Spearman est de 0,7818 et que la valeur p correspondante est de 0,01165 .

Cela indique qu’il existe une forte corrélation positive entre les deux vecteurs.

Puisque la valeur p de la corrélation est inférieure à 0,05, la corrélation est statistiquement significative.

Ressources additionnelles

Comment calculer la corrélation partielle dans R
Comment calculer l’autocorrélation dans R
Comment calculer la corrélation glissante dans R
Comment signaler la corrélation de Spearman au format APA

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *