5 beispiele für falsche korrelationen im wirklichen leben
Als Scheinkorrelation bezeichnet man in der Statistik eine Korrelation zwischen zwei Variablen, die rein zufällig auftritt, ohne dass eine Variable tatsächlich die andere verursacht.
Diese Art der Korrelation ist gefährlich, da sie manchmal suggerieren kann, dass eine Variable eine andere verursacht, obwohl die Korrelation in Wirklichkeit rein zufällig besteht.
Es stellt sich heraus, dass diese Art der Korrelation zwischen Variablen im wirklichen Leben ständig vorkommt.
Die folgenden Beispiele zeigen fünf verschiedene reale Beispiele falscher Korrelation.
Beispiel 1: Meisterschaften und Einnahmen an den Kinokassen
Wenn wir Daten über die Gesamtzahl der jedes Jahr von Universitäten vergebenen Masterabschlüsse und die pro Jahr erzielten Gesamteinnahmen an den Kinokassen sammeln, würden wir feststellen, dass die beiden Variablen stark korrelieren.
Dies bedeutet nicht, dass die Vergabe weiterer Master-Abschlüsse jedes Jahr zu höheren Einnahmen an den Kinokassen führt.
Die wahrscheinlichste Erklärung ist, dass die Weltbevölkerung jedes Jahr wächst, was bedeutet, dass jedes Jahr mehr Master-Abschlüsse verliehen werden und die Zahl der Menschen, die jedes Jahr ins Kino gehen, in etwa im gleichen Verhältnis zunimmt.
Die Korrelation zwischen den beiden Variablen ist falsch.
Beispiel 2: Masernfälle im Verhältnis zur Heiratsrate
Wenn wir jedes Jahr Daten zur Gesamtzahl der Masernfälle in den Vereinigten Staaten und zur Heiratsrate sammeln würden, würden wir feststellen, dass die beiden Variablen stark korrelieren.
Dies bedeutet nicht, dass die Reduzierung der Masernfälle irgendwie zu niedrigeren Heiratsraten führt. Die beiden Variablen sind unabhängig.
Die moderne Medizin führt lediglich dazu, dass die Masernfälle zurückgehen und aus verschiedenen Gründen jedes Jahr weniger Menschen heiraten.
Die Korrelation zwischen den beiden Variablen ist falsch.
Beispiel 3: Abiturienten im Verhältnis zum Donutkonsum
Wenn wir jedes Jahr Daten über die Gesamtzahl der High-School-Absolventen und den gesamten Donut-Verbrauch in den Vereinigten Staaten sammeln würden, würden wir feststellen, dass die beiden Variablen stark korrelieren.
Dies bedeutet nicht, dass der Anstieg der Zahl der High-School-Absolventen zu einem erhöhten Donut-Konsum in den Vereinigten Staaten führt.
Die wahrscheinlichste Erklärung ist, dass die US-Bevölkerung im Laufe der Zeit gewachsen ist, was bedeutet, dass die Zahl der Menschen mit einem High-School-Abschluss und die Gesamtzahl der konsumierten Donuts mit zunehmender Bevölkerung zunimmt.
Das ist eine falsche Korrelation.
Beispiel 4: Videospielverkäufe versus Atomstromproduktion
Wenn wir Daten über den jährlichen Gesamtumsatz von Videospielen weltweit und die gesamte von Kernkraftwerken erzeugte Energie sammeln würden, würden wir feststellen, dass die beiden Variablen stark korrelieren.
Dies bedeutet nicht, dass höhere Videospielverkäufe zu einer erhöhten Atomstromproduktion führen.
Stattdessen werden mehr Atomkraftwerke gebaut und mehr Videospiele verkauft, da die Weltbevölkerung jedes Jahr wächst.
Auch wenn beide Größen im Laufe der Zeit kontinuierlich zunehmen, ist die eine nicht die Ursache für die andere. Die Korrelation zwischen den beiden ist falsch.
Beispiel 5: Arkadeneinkommen vs. Jobs im Kohlebergwerk
Wenn wir Daten über die Gesamteinnahmen der Spielhallen in den Vereinigten Staaten und die Gesamtzahl der Arbeitsplätze im Kohlebergbau in den Vereinigten Staaten sammeln, würden wir feststellen, dass die beiden Variablen stark korrelieren.
Dies bedeutet nicht, dass eine Variable dazu führt, dass die andere abnimmt.
Stattdessen sind Spielhallen und Kohlebergwerke im Laufe der Jahre seltener geworden, was erklärt, warum beide Variablen ungefähr im gleichen Ausmaß zurückgegangen sind.
Die Korrelation zwischen den beiden Variablen ist falsch.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten reale Beispiele für andere statistische Konzepte:
Beispiele für die Verwendung von Wahrscheinlichkeiten im wirklichen Leben
Beispiele für die Verwendung von Korrelationen im wirklichen Leben
Beispiele für die Verwendung von Mittelwert, Median und Modus im wirklichen Leben