Problème de troisième variable : définition & Exemple
En statistiques, un problème de troisième variable survient lorsqu’une corrélation observée entre deux variables peut en réalité être expliquée par une troisième variable qui n’a pas été prise en compte.
Lorsque cette troisième variable n’est pas prise en compte, la corrélation entre les deux variables étudiées peut être trompeuse, voire prêter à confusion.
Ce didacticiel fournit plusieurs exemples de problèmes de troisième variable dans différents contextes.
Exemple 1 : Chiens et bouches d’incendie
Un chercheur observe que les villes qui comptent plus de bouches d’incendie ont également tendance à avoir plus de chiens.
Cependant, ces deux variables ne sont corrélées que parce qu’elles ont toutes deux une forte corrélation avec une troisième variable : la taille de la population .
Les grandes villes ont tendance à avoir à la fois plus de bouches d’incendie et plus de chiens. À l’inverse, les petites villes ont tendance à avoir moins de bouches d’incendie et moins de chiens.
Exemple 2 : Ventes de glaces et attaques de requins
Un chercheur découvre que les ventes de glaces et les attaques de requins sont fortement corrélées positivement.
Cependant, ces deux variables ne sont corrélées que parce qu’elles ont toutes deux une forte corrélation avec une troisième variable : la température .
Lorsqu’il fait plus chaud, plus de gens achètent des glaces et plus de gens nagent dans l’océan, ce qui explique pourquoi les valeurs des ventes de glaces et des attaques de requins ont tendance à augmenter aux mêmes périodes de l’année.
Exemple 3 : Volontaires et catastrophes naturelles
Une étude révèle que plus il y a de volontaires qui se présentent après une catastrophe naturelle, plus les dégâts sont importants.
Cependant, ces deux variables ne sont corrélées que parce qu’elles ont toutes deux une forte corrélation avec une troisième variable : l’ampleur de la catastrophe naturelle .
Les catastrophes naturelles de plus grande ampleur sont fortement corrélées à davantage de dégâts causés ainsi qu’à une augmentation du nombre de bénévoles.
Articles Liés
Qu’est-ce que le biais de variable omise ?
Qu’est-ce que le biais de sous-dénombrement ?
Qu’est-ce que le biais d’agrégation ?
Qu’est-ce qu’une variable confusionnelle ?