Кореляція не означає причинно-наслідковий зв’язок: 5 конкретних прикладів
Фраза « кореляція не передбачає причинного зв’язку » часто використовується в статистиці, щоб підкреслити, що кореляція між двома змінними не обов’язково означає, що одна змінна викликає іншу.
Щоб краще зрозуміти цей вираз, розглянемо наступні конкретні приклади.
Приклад 1: продаж морозива та напад акул
Якби ми щороку збирали дані про місячні продажі морозива та щомісячні напади акул у Сполучених Штатах, ми виявили б, що ці дві змінні сильно корелюють.

Чи означає це, що вживання морозива викликає напади акул?
Недостатньо. Найвірогідніше пояснення полягає в тому, що більше людей споживають морозиво та купаються в океані, коли на вулиці тепліше, що пояснює, чому ці дві змінні так сильно корелюють.
Хоча продажі морозива та напади акул тісно пов’язані, одне не викликає іншого.
Приклад 2: майстерність і касовий дохід
Якщо ми зіберемо дані про загальну кількість магістерських ступенів, які присуджуються університетами щороку, і загальний прибутковий прибуток за рік, ми виявимо, що ці дві змінні сильно корелюють.

Чи означає це, що видача більшої кількості дипломів магістра призводить до збільшення касових зборів щороку?
Недостатньо. Найвірогідніше пояснення полягає в тому, що населення світу щороку збільшується, а це означає, що щороку присуджується більше магістерських ступенів, і кількість людей, які ходять у кіно, щороку зростає приблизно в однакових пропорціях.
Хоча ці дві змінні корельовані, одна не викликає іншу.
Приклад 3: утоплення в басейнах у зв’язку з виробництвом атомної енергії
Якби ми зібрали дані про загальну кількість випадків утоплення в басейнах щороку та загальну кількість енергії, виробленої щороку атомними електростанціями, ми виявили б, що ці дві змінні сильно корелюють.

Чи означає це, що збільшення випадків утоплення в басейнах якимось чином призводить до збільшення виробництва ядерної енергії?
Не зовсім. Найвірогідніше пояснення полягає в тому, що населення світу збільшилося, а це означає, що все більше людей тонуть у басейнах, а виробництво атомної енергії з кожним роком стає все більш життєздатним, тому воно зросло.
Хоча ці дві змінні сильно корелюють, одна не викликає іншу.
Приклад 4: Випадки кору по відношенню до кількості шлюбів
Якби ми щороку збирали дані про загальну кількість випадків кору в Сполучених Штатах і рівень шлюбу, ми виявили б, що ці дві змінні сильно корелюють.

Чи означає це, що менша кількість випадків кору призводить до зниження кількості шлюбів?
Не зовсім. Натомість ці дві змінні є незалежними: сучасна медицина сприяє зниженню випадків захворювання на кір, і щороку менше людей одружуються з різних причин.
Хоча ці дві змінні сильно корелюють, одна не викликає іншу.
Приклад 5: випускники середньої школи щодо споживання піци
Якби ми щороку збирали дані про загальну кількість випускників середньої школи та загальне споживання піци в Сполучених Штатах, ми виявили б, що ці дві змінні сильно корелюють.

Чи означає це, що зростання кількості випускників середньої школи призводить до зростання споживання піци в Сполучених Штатах?
Недостатньо. Найбільш ймовірним поясненням є те, що населення США з часом зросло, тобто кількість людей із дипломом про середню освіту та загальна кількість спожитої піци зростає разом зі збільшенням населення.
Хоча ці дві змінні корельовані, одна не викликає іншу.
Додаткові ресурси
У наступних посібниках надається додаткова інформація про кореляцію:
Вступ до коефіцієнта кореляції Пірсона
Чи передбачає причинно-наслідковий зв’язок кореляцію?
Кореляція vs. асоціація: яка різниця?
Що вважається «сильною» кореляцією?
Коли слід використовувати кореляцію?