La corrélation n’implique pas la causalité : 5 exemples concrets
L’expression « corrélation n’implique pas causalité » est souvent utilisée en statistique pour souligner que la corrélation entre deux variables ne signifie pas nécessairement qu’une variable provoque l’autre.
Pour mieux comprendre cette expression, considérons les exemples concrets suivants.
Exemple 1 : Ventes de glaces et attaques de requins
Si nous collectons chaque année des données sur les ventes mensuelles de glaces et les attaques mensuelles de requins aux États-Unis, nous constaterions que les deux variables sont fortement corrélées.
Cela signifie-t-il que consommer de la glace provoque des attaques de requins ?
Pas assez. L’explication la plus probable est que davantage de personnes consomment de la glace et se baignent dans l’océan lorsqu’il fait plus chaud dehors, ce qui explique pourquoi ces deux variables sont si fortement corrélées.
Bien que les ventes de glaces et les attaques de requins soient fortement corrélées, l’une n’entraîne pas l’autre.
Exemple 2 : Maîtrises et revenus du box-office
Si nous collectons des données sur le nombre total de diplômes de maîtrise délivrés par les universités chaque année et sur les recettes totales du box-office générées par année, nous constaterions que les deux variables sont fortement corrélées.
Cela signifie-t-il que la délivrance de plus de diplômes de Master entraîne une augmentation des recettes du box-office chaque année ?
Pas assez. L’explication la plus probable est que la population mondiale augmente chaque année, ce qui signifie que davantage de diplômes de maîtrise sont délivrés chaque année et que le nombre de personnes allant au cinéma chaque année augmente dans des proportions à peu près égales.
Bien que ces deux variables soient corrélées, l’une n’entraîne pas l’autre.
Exemple 3 : noyades en piscine par rapport à la production d’énergie nucléaire
Si nous collectons des données sur le nombre total de noyades en piscine chaque année et sur la quantité totale d’énergie produite chaque année par les centrales nucléaires, nous constaterions que les deux variables sont fortement corrélées.
Cela signifie-t-il que l’augmentation des noyades dans les piscines entraîne d’une manière ou d’une autre une production accrue d’énergie nucléaire ?
Pas exactement. L’explication la plus probable est que la population mondiale a augmenté, ce qui signifie que de plus en plus de personnes se noient dans les piscines et que la production d’énergie nucléaire devient chaque année plus viable, ce qui explique pourquoi elle a augmenté.
Bien que ces deux variables soient fortement corrélées, l’une n’entraîne pas l’autre.
Exemple 4 : Cas de rougeole par rapport au taux de nuptialité
Si nous collectons chaque année des données sur le nombre total de cas de rougeole aux États-Unis et sur le taux de nuptialité, nous constaterions que les deux variables sont fortement corrélées.
Cela signifie-t-il que la diminution des cas de rougeole entraîne une baisse des taux de nuptialité ?
Pas exactement. Au lieu de cela, les deux variables sont indépendantes : la médecine moderne entraîne une baisse des cas de rougeole et de moins en moins de personnes se marient chaque année pour diverses raisons.
Bien que ces deux variables soient fortement corrélées, l’une n’entraîne pas l’autre.
Exemple 5 : Diplômés du secondaire par rapport à la consommation de pizza
Si nous collectons chaque année des données sur le nombre total de diplômés du secondaire et la consommation totale de pizza aux États-Unis, nous constaterions que les deux variables sont fortement corrélées.
Cela signifie-t-il qu’un nombre croissant de diplômés du secondaire entraîne une consommation accrue de pizza aux États-Unis ?
Pas assez. L’explication la plus probable est que la population américaine a augmenté au fil du temps, ce qui signifie que le nombre de personnes titulaires d’un diplôme d’études secondaires et la quantité totale de pizza consommée augmentent à mesure que la population augmente.
Bien que ces deux variables soient corrélées, l’une n’entraîne pas l’autre.
Ressources additionnelles
Les didacticiels suivants fournissent des informations supplémentaires sur la corrélation :
Une introduction au coefficient de corrélation de Pearson
La causalité implique-t-elle une corrélation ?
Corrélation vs association : quelle est la différence ?
Qu’est-ce qui est considéré comme une corrélation « forte » ?
Quand devriez-vous utiliser la corrélation ?