Comment calculer manuellement un coefficient de corrélation de Pearson
Un coefficient de corrélation de Pearson mesure l’association linéaire entre deux variables.
Il prend toujours une valeur comprise entre -1 et 1 où :
- -1 indique une corrélation linéaire parfaitement négative entre deux variables
- 0 indique aucune corrélation linéaire entre deux variables
- 1 indique une corrélation linéaire parfaitement positive entre deux variables
La formule pour calculer un coefficient de corrélation de Pearson, noté r , est :
Ce didacticiel fournit un exemple étape par étape de la façon de calculer manuellement un coefficient de corrélation de Pearson pour l’ensemble de données suivant :
Étape 1 : Calculer la moyenne de X et Y
Tout d’abord, nous allons calculer la moyenne des valeurs X et Y :
Étape 2 : Calculer la différence entre les moyennes
Ensuite, nous calculerons la différence entre chacune des valeurs individuelles X et Y et leurs moyennes respectives :
Étape 3 : Calculer les valeurs restantes
Ensuite, nous calculerons les valeurs restantes nécessaires pour compléter la formule du coefficient de corrélation de Pearson :
Étape 4 : Calculer les sommes
Ensuite, nous calculerons les sommes des trois dernières colonnes :
Étape 5 : Calculer le coefficient de corrélation de Pearson
Maintenant, nous allons simplement intégrer les sommes de l’étape précédente dans la formule du coefficient de corrélation de Pearson :
Le coefficient de corrélation de Pearson s’avère être de 0,947 .
Puisque cette valeur est proche de 1, cela indique que X et Y sont fortement corrélés positivement.
En d’autres termes, à mesure que la valeur de X augmente, la valeur de Y augmente également de manière hautement prévisible.
Ressources additionnelles
Une introduction au coefficient de corrélation de Pearson
Comment trouver un intervalle de confiance pour un coefficient de corrélation