Types de corrélation
Cet article explique ce que sont tous les types de corrélation. Ainsi, vous trouverez plusieurs manières de classer la corrélation : selon que la relation est positive ou négative, selon la valeur du coefficient de corrélation, selon le nombre de variables,…
Quels sont les types de corrélation linéaire ?
Pour classer la relation entre deux variables aléatoires, on distingue les types de corrélation linéaire suivants :
- Corrélation directe (ou corrélation positive) : une variable augmente lorsque l’autre augmente également.
- Corrélation inverse (ou corrélation négative) : lorsqu’une variable augmente, l’autre diminue, et vice versa, si une variable diminue, l’autre augmente.
- Corrélation nulle (pas de corrélation) : Il n’y a aucune relation entre les deux variables.
Selon la nature des données, la corrélation directe peut également être en même temps une corrélation directement proportionnelle, bien que pour cela le facteur qui relie les deux variables doit toujours être le même. Par conséquent, toutes les relations directement proportionnelles sont des exemples de corrélation directe, puisque les deux variables augmentent ensemble, mais toutes les relations directes ne sont pas directement proportionnelles car le degré de corrélation peut varier selon la portée.
De même, toutes les variables inversement proportionnelles ont également une corrélation négative. Cependant, toutes les variables ayant une corrélation négative ne sont pas inversement proportionnelles, puisque pour être considérées comme telles, la relation mathématique entre elles doit être constante pour toutes les paires de données.
Types de corrélation selon le degré de corrélation
Que la corrélation entre les deux variables soit directe ou inverse, la corrélation peut également être classée en fonction de la force ou de la faiblesse de la relation entre les deux variables.
- Forte corrélation : les deux variables sont étroitement liées. Si vous tracez les données sur un nuage de points, les points sont très rapprochés. Il est donc plus facile d’identifier la relation entre les variables.
- Faible corrélation : il existe une relation entre les deux variables, mais elle est difficile à identifier. Les points sont éloignés les uns des autres sur le nuage de points.
Pour savoir si la corrélation entre deux variables est forte ou faible, il faut calculer le coefficient de corrélation. Plus la valeur absolue du coefficient de corrélation est élevée, plus la corrélation entre les variables est forte.
Ainsi, sur la base de la valeur du coefficient de corrélation, la relation entre deux variables statistiques différentes peut être classée dans les types suivants :
Valeur du coefficient de corrélation | Type de corrélation |
---|---|
-1 | corrélation négative parfaite |
-0,9 à -0,99 | très forte corrélation négative |
-0,7 à -0,89 | forte corrélation négative |
-0,4 à -0,69 | corrélation négative modérée |
-0,2 à -0,39 | faible corrélation négative |
-0,01 à -0,19 | corrélation négative très faible |
0 | corrélation nulle |
0,01 à 0,19 | corrélation positive très faible |
0,2 à 0,39 | Faible corrélation positive |
0,4 à 0,69 | corrélation positive modérée |
0,7 à 0,89 | forte corrélation positive |
0,9 à 0,99 | très forte corrélation positive |
1 | corrélation positive parfaite |
Autres types de corrélation
Nous venons de voir quels sont les différents types de corrélations linéaires, cependant, il faut garder à l’esprit qu’il existe d’autres façons de classer les types de corrélations selon d’autres critères.
Si l’on regroupe les types de corrélation selon la nature de la relation entre les variables, on distingue :
- Corrélation linéaire – La relation entre les deux variables peut être représentée par une ligne droite.
- Corrélation non linéaire : la relation entre les deux variables ne peut pas être représentée par une ligne droite, mais il faut plutôt utiliser une fonction plus complexe, comme une parabole ou un logarithme.
D’autre part, la corrélation peut également être séparée en différents groupes selon le nombre de variables :
- Corrélation simple : seule la relation entre deux variables est étudiée.
- Corrélation multiple : la relation entre plus de deux variables est étudiée.
- Corrélation partielle : lorsque la relation entre deux variables n’affecte pas les autres variables de l’ensemble de données.