5 прикладів хибних кореляцій у реальному житті
У статистиці помилкова кореляція означає кореляцію між двома змінними, яка виникає випадково, але одна змінна фактично не викликає іншу.
Цей тип кореляції небезпечний, оскільки іноді може припустити, що одна змінна викликає іншу, хоча насправді кореляція існує чисто випадково.
Виявляється, такий тип кореляції між змінними відбувається постійно в реальному житті.
У наведених нижче прикладах представлено п’ять різних реальних прикладів хибної кореляції.
Приклад 1: майстерність і касовий дохід
Якщо ми зіберемо дані про загальну кількість магістерських ступенів, які присуджуються університетами щороку, і загальний прибутковий прибуток за рік, ми виявимо, що ці дві змінні сильно корелюють.
Це не означає, що видача більшої кількості дипломів магістра призводить до збільшення касових зборів щороку.
Найвірогідніше пояснення полягає в тому, що населення світу щороку збільшується, а це означає, що щороку присуджується більше магістерських ступенів, і кількість людей, які ходять у кіно, щороку зростає приблизно в однакових пропорціях.
Кореляція між двома змінними є помилковою.
Приклад 2: Захворюваність на кір по відношенню до кількості шлюбів
Якби ми щороку збирали дані про загальну кількість випадків кору в Сполучених Штатах і рівень шлюбу, ми виявили б, що ці дві змінні сильно корелюють.
Це не означає, що зменшення випадків кору якимось чином призводить до зниження кількості шлюбів. Ці дві змінні є незалежними.
Сучасна медицина просто сприяє зниженню випадків захворювання на кір і щороку з різних причин все менше людей одружуються.
Кореляція між двома змінними є помилковою.
Приклад 3: випускники середньої школи щодо споживання пончиків
Якби ми щороку збирали дані про загальну кількість випускників середньої школи та загальне споживання пончиків у Сполучених Штатах, ми виявили б, що ці дві змінні сильно корелюють.
Це не означає, що збільшення кількості випускників середньої школи призводить до збільшення споживання пончиків у Сполучених Штатах.
Найбільш ймовірним поясненням є те, що населення США з часом зросло, тобто кількість людей із дипломом про середню освіту та загальна кількість спожитих пончиків зростає зі збільшенням населення.
Це хибна кореляція.
Приклад 4: Продажі відеоігор проти виробництва ядерної енергії
Якби ми зібрали дані про загальний обсяг продажів відеоігор щороку в усьому світі та загальну кількість енергії, виробленої атомними електростанціями, ми виявили б, що ці дві змінні сильно корелюють.
Це не означає, що збільшення продажів відеоігор призводить до збільшення виробництва ядерної енергії.
Натомість будується більше атомних електростанцій і продається більше відеоігор, оскільки населення світу щороку збільшується.
Незважаючи на те, що обидві змінні постійно зростають з часом, одна не є причиною іншої. Кореляція між ними є помилковою.
Приклад 5: Дохід від аркад проти Вакансії на вугільній шахті
Якщо ми зберемо дані про загальний дохід, отриманий від ігрових автоматів у Сполучених Штатах, і загальну кількість робочих місць у вугільних шахтах у Сполучених Штатах, ми побачимо, що ці дві змінні сильно корелюють.
Це не означає, що одна змінна призводить до зменшення іншої.
Натомість аркади та вугільні шахти з роками стали менш поширеними, що пояснює, чому обидві змінні зменшилися з приблизно однаковою швидкістю.
Кореляція між двома змінними є помилковою.
Додаткові ресурси
Наступні навчальні посібники надають реальні приклади інших статистичних концепцій:
Приклади використання ймовірності в реальному житті
Приклади використання кореляції в реальному житті
Приклади використання середнього значення, медіани та моди в реальному житті