5 exemples de fausses corrélations dans la vie réelle
En statistiques, une fausse corrélation fait référence à une corrélation entre deux variables qui se produit purement par hasard sans qu’une variable ne provoque réellement l’autre.
Ce type de corrélation est dangereux car il peut parfois laisser penser qu’une variable en entraîne une autre, alors qu’en réalité la corrélation existe purement par hasard.
Il s’avère que ce type de corrélation entre variables se produit tout le temps dans la vie réelle.
Les exemples suivants partagent cinq exemples réels différents de fausse corrélation.
Exemple 1 : Maîtrises et revenus du box-office
Si nous collectons des données sur le nombre total de diplômes de maîtrise délivrés par les universités chaque année et sur les recettes totales du box-office générées par année, nous constaterions que les deux variables sont fortement corrélées.
Cela ne signifie pas que la délivrance d’un plus grand nombre de diplômes de maîtrise entraîne une augmentation des recettes du box-office chaque année.
L’explication la plus probable est que la population mondiale augmente chaque année, ce qui signifie que davantage de diplômes de maîtrise sont délivrés chaque année et que le nombre de personnes allant au cinéma chaque année augmente dans des proportions à peu près égales.
La corrélation entre les deux variables est fallacieuse.
Exemple 2 : Cas de rougeole par rapport au taux de nuptialité
Si nous collectons chaque année des données sur le nombre total de cas de rougeole aux États-Unis et sur le taux de nuptialité, nous constaterions que les deux variables sont fortement corrélées.
Cela ne signifie pas que la réduction des cas de rougeole entraîne d’une manière ou d’une autre une baisse des taux de nuptialité. Les deux variables sont indépendantes.
La médecine moderne fait simplement baisser les cas de rougeole et de moins en moins de personnes se marient chaque année pour diverses raisons.
La corrélation entre les deux variables est fallacieuse.
Exemple 3 : Diplômés du secondaire par rapport à la consommation de beignets
Si nous collectons chaque année des données sur le nombre total de diplômés du secondaire et la consommation totale de beignets aux États-Unis, nous constaterions que les deux variables sont fortement corrélées.
Cela ne signifie pas que l’augmentation du nombre de diplômés du secondaire entraîne une consommation accrue de beignets aux États-Unis.
L’explication la plus probable est que la population américaine a augmenté au fil du temps, ce qui signifie que le nombre de personnes titulaires d’un diplôme d’études secondaires et le nombre total de beignets consommés augmentent à mesure que la population augmente.
Il s’agit d’une fausse corrélation.
Exemple 4 : Ventes de jeux vidéo par rapport à la production d’énergie nucléaire
Si nous collectons des données sur les ventes totales de jeux vidéo chaque année dans le monde et sur l’énergie totale produite par les centrales nucléaires, nous constaterions que les deux variables sont fortement corrélées.
Cela ne signifie pas que l’augmentation des ventes de jeux vidéo entraîne une augmentation de la production d’énergie nucléaire.
Au lieu de cela, davantage de centrales nucléaires sont construites et davantage de jeux vidéo sont vendus à mesure que la population mondiale augmente chaque année.
Même si les deux variables augmentent régulièrement au fil du temps, l’une n’est pas la cause de l’autre. La corrélation entre les deux est fallacieuse.
Exemple 5 : Revenus des arcades par rapport aux emplois dans les mines de charbon
Si nous collectons des données sur les revenus totaux générés par les salles d’arcade aux États-Unis et sur le nombre total d’emplois dans les mines de charbon aux États-Unis, nous constaterions que les deux variables sont fortement corrélées.
Cela ne signifie pas qu’une variable entraîne une diminution de l’autre.
Au lieu de cela, les arcades et les mines de charbon sont devenues moins courantes au fil des années, ce qui explique pourquoi les deux variables ont diminué à peu près au même rythme.
La corrélation entre les deux variables est fallacieuse.
Ressources additionnelles
Les didacticiels suivants fournissent des exemples concrets d’autres concepts statistiques :
Exemples d’utilisation des probabilités dans la vie réelle
Exemples d’utilisation de la corrélation dans la vie réelle
Exemples d’utilisation de la moyenne, de la médiane et du mode dans la vie réelle