Problème de troisième variable : définition & Exemple



En statistiques, un problème de troisième variable survient lorsqu’une corrélation observée entre deux variables peut en réalité être expliquée par une troisième variable qui n’a pas été prise en compte.

Lorsque cette troisième variable n’est pas prise en compte, la corrélation entre les deux variables étudiées peut être trompeuse, voire prêter à confusion.

Ce didacticiel fournit plusieurs exemples de problèmes de troisième variable dans différents contextes.

Exemple 1 : Chiens et bouches d’incendie

Un chercheur observe que les villes qui comptent plus de bouches d’incendie ont également tendance à avoir plus de chiens.

Cependant, ces deux variables ne sont corrélées que parce qu’elles ont toutes deux une forte corrélation avec une troisième variable : la taille de la population .

Les grandes villes ont tendance à avoir à la fois plus de bouches d’incendie et plus de chiens. À l’inverse, les petites villes ont tendance à avoir moins de bouches d’incendie et moins de chiens.

Exemple de problème de troisième variable

Exemple 2 : Ventes de glaces et attaques de requins

Un chercheur découvre que les ventes de glaces et les attaques de requins sont fortement corrélées positivement.

Cependant, ces deux variables ne sont corrélées que parce qu’elles ont toutes deux une forte corrélation avec une troisième variable : la température .

Lorsqu’il fait plus chaud, plus de gens achètent des glaces et plus de gens nagent dans l’océan, ce qui explique pourquoi les valeurs des ventes de glaces et des attaques de requins ont tendance à augmenter aux mêmes périodes de l’année.

Problème de troisième variable

Exemple 3 : Volontaires et catastrophes naturelles

Une étude révèle que plus il y a de volontaires qui se présentent après une catastrophe naturelle, plus les dégâts sont importants.

Cependant, ces deux variables ne sont corrélées que parce qu’elles ont toutes deux une forte corrélation avec une troisième variable : l’ampleur de la catastrophe naturelle .

Les catastrophes naturelles de plus grande ampleur sont fortement corrélées à davantage de dégâts causés ainsi qu’à une augmentation du nombre de bénévoles.

Exemple d'un problème à troisième variable dans le monde réel

Articles Liés

Qu’est-ce que le biais de variable omise ?
Qu’est-ce que le biais de sous-dénombrement ?
Qu’est-ce que le biais d’agrégation ?
Qu’est-ce qu’une variable confusionnelle ?

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *