5 przykładów fałszywych korelacji w prawdziwym życiu
W statystyce fałszywa korelacja odnosi się do korelacji między dwiema zmiennymi, która pojawia się całkowicie przypadkowo, przy czym jedna zmienna w rzeczywistości nie powoduje drugiej.
Ten typ korelacji jest niebezpieczny, ponieważ czasami może sugerować, że jedna zmienna powoduje drugą, podczas gdy w rzeczywistości korelacja istnieje wyłącznie przez przypadek.
Okazuje się, że tego typu korelacja pomiędzy zmiennymi zdarza się cały czas w prawdziwym życiu.
W poniższych przykładach przedstawiono pięć różnych rzeczywistych przykładów fałszywej korelacji.
Przykład 1: Mastery i dochody ze sprzedaży biletów
Jeśli zbierzemy dane na temat całkowitej liczby stopni magisterskich przyznawanych każdego roku przez uniwersytety oraz całkowitych przychodów ze sprzedaży biletów generowanych w ciągu roku, odkryjemy, że te dwie zmienne są silnie skorelowane.

Nie oznacza to, że wydawanie większej liczby stopni magisterskich skutkuje corocznym wzrostem przychodów ze sprzedaży biletów.
Najbardziej prawdopodobnym wyjaśnieniem jest to, że liczba ludności na świecie rośnie z każdym rokiem, co oznacza, że każdego roku przyznawanych jest więcej stopni magisterskich, a liczba osób chodzących do kina każdego roku rośnie w mniej więcej równych proporcjach.
Korelacja między tymi dwiema zmiennymi jest fałszywa.
Przykład 2: Liczba przypadków odry w odniesieniu do wskaźnika zawieranych małżeństw
Gdybyśmy co roku gromadzili dane na temat całkowitej liczby przypadków odry w Stanach Zjednoczonych i wskaźnika zawieranych małżeństw, odkrylibyśmy, że te dwie zmienne są silnie skorelowane.

Nie oznacza to, że zmniejszenie liczby przypadków odry w jakiś sposób prowadzi do niższego wskaźnika małżeństw. Obie zmienne są niezależne.
Współczesna medycyna powoduje po prostu spadek zachorowań na odrę i z różnych powodów coraz mniej osób zawiera związek małżeński.
Korelacja między tymi dwiema zmiennymi jest fałszywa.
Przykład 3: Absolwenci szkół średnich a spożycie pączków
Gdybyśmy co roku zbierali dane na temat całkowitej liczby absolwentów szkół średnich i całkowitego spożycia pączków w Stanach Zjednoczonych, odkrylibyśmy, że te dwie zmienne są silnie skorelowane.

Nie oznacza to jednak, że wzrost liczby absolwentów szkół średnich prowadzi do zwiększonej konsumpcji pączków w Stanach Zjednoczonych.
Najbardziej prawdopodobnym wyjaśnieniem jest to, że populacja USA zwiększała się z biegiem czasu, co oznacza, że wraz ze wzrostem populacji wzrasta liczba osób z dyplomem szkoły średniej i całkowita liczba spożytych pączków.
Jest to fałszywa korelacja.
Przykład 4: Sprzedaż gier wideo a produkcja energii jądrowej
Gdybyśmy zebrali dane dotyczące całkowitej rocznej sprzedaży gier wideo na całym świecie oraz całkowitej energii wyprodukowanej w elektrowniach jądrowych, odkrylibyśmy, że te dwie zmienne są silnie skorelowane.

Nie oznacza to, że zwiększona sprzedaż gier wideo prowadzi do zwiększenia produkcji energii jądrowej.
Zamiast tego buduje się więcej elektrowni jądrowych i sprzedaje się więcej gier wideo w miarę wzrostu światowej populacji z roku na rok.
Chociaż obie zmienne stale rosną w czasie, jedna nie jest przyczyną drugiej. Korelacja między nimi jest fałszywa.
Przykład 5: Dochody z salonów gier vs. Praca w kopalni węgla
Jeśli zbierzemy dane na temat całkowitych przychodów generowanych przez salony gier w Stanach Zjednoczonych i całkowitą liczbę miejsc pracy w górnictwie węglowym w Stanach Zjednoczonych, odkryjemy, że te dwie zmienne są silnie skorelowane.

Nie oznacza to, że jedna zmienna powoduje spadek drugiej.
Zamiast tego pasaże i kopalnie węgla stały się z biegiem lat coraz mniej powszechne, co wyjaśnia, dlaczego obie zmienne spadały mniej więcej w tym samym tempie.
Korelacja między tymi dwiema zmiennymi jest fałszywa.
Dodatkowe zasoby
Poniższe samouczki zawierają rzeczywiste przykłady innych koncepcji statystycznych:
Przykłady wykorzystania prawdopodobieństwa w życiu codziennym
Przykłady wykorzystania korelacji w życiu codziennym
Przykłady użycia średniej, mediany i trybu w prawdziwym życiu