Drittes variablenproblem: definition und beispiel


In der Statistik tritt ein Problem mit dritten Variablen auf, wenn eine beobachtete Korrelation zwischen zwei Variablen tatsächlich durch eine dritte Variable erklärt werden kann, die nicht berücksichtigt wurde.

Wenn diese dritte Variable nicht berücksichtigt wird, kann die Korrelation zwischen den beiden untersuchten Variablen irreführend sein oder sogar zu Verwirrung führen.

Dieses Tutorial bietet mehrere Beispiele für Probleme mit dritten Variablen in verschiedenen Kontexten.

Beispiel 1: Hunde und Hydranten

Ein Forscher beobachtet, dass Städte mit mehr Hydranten tendenziell auch mehr Hunde haben.

Diese beiden Variablen korrelieren jedoch nur, weil sie beide eine starke Korrelation mit einer dritten Variablen aufweisen: der Bevölkerungsgröße .

In größeren Städten gibt es tendenziell sowohl mehr Hydranten als auch mehr Hunde. Umgekehrt gibt es in kleineren Städten tendenziell weniger Hydranten und weniger Hunde.

Beispiel für ein Problem mit der dritten Variablen

Beispiel 2: Eisverkauf und Hai-Angriffe

Forscher stellen fest, dass Eisverkauf und Hai-Angriffe stark positiv korrelieren.

Diese beiden Variablen korrelieren jedoch nur, weil sie beide eine starke Korrelation mit einer dritten Variablen aufweisen: der Temperatur .

Wenn es wärmer ist, kaufen mehr Menschen Eis und mehr Menschen schwimmen im Meer, was erklärt, warum die Werte von Eisverkäufen und Hai-Angriffen zur gleichen Jahreszeit tendenziell steigen.

Drittes Variablenproblem

Beispiel 3: Freiwillige und Naturkatastrophen

Eine Studie kommt zu dem Ergebnis, dass der Schaden umso größer ist, je mehr Freiwillige sich nach einer Naturkatastrophe melden.

Diese beiden Variablen korrelieren jedoch nur, weil sie beide eine starke Korrelation mit einer dritten Variablen aufweisen: dem Ausmaß der Naturkatastrophe .

Größere Naturkatastrophen korrelieren stark mit mehr verursachten Schäden sowie einem Anstieg der Zahl freiwilliger Helfer.

Beispiel für ein drittes Variablenproblem in der realen Welt

In Verbindung stehende Artikel

Was ist ein Bias durch ausgelassene Variablen?
Was ist ein Undercount-Bias?
Was ist ein Aggregationsbias?
Was ist eine verwirrende Variable?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert