5 примеров ложных корреляций в реальной жизни
В статистике ложная корреляция относится к корреляции между двумя переменными, которая возникает чисто случайно, при этом одна переменная фактически не вызывает другую.
Этот тип корреляции опасен, поскольку иногда он может указывать на то, что одна переменная вызывает другую, хотя на самом деле корреляция существует чисто случайно.
Оказывается, такого рода корреляция между переменными происходит постоянно в реальной жизни.
В следующих примерах представлены пять различных реальных примеров ложной корреляции.
Пример 1: Мастерство и кассовые сборы
Если мы соберем данные об общем количестве степеней магистра, присуждаемых университетами каждый год, и общих кассовых сборах, полученных за год, мы обнаружим, что эти две переменные сильно коррелируют.
Это не означает, что выдача большего количества степеней магистра приводит к ежегодному увеличению кассовых сборов.
Наиболее вероятное объяснение состоит в том, что население мира увеличивается с каждым годом, а это означает, что каждый год присуждается больше степеней магистра, и количество людей, идущих в кино, каждый год увеличивается примерно в равных пропорциях.
Корреляция между двумя переменными является ложной.
Пример 2: Случаи кори в зависимости от уровня брака
Если бы мы каждый год собирали данные об общем количестве случаев кори в Соединенных Штатах и уровне брака, мы бы обнаружили, что эти две переменные сильно коррелируют.
Это не означает, что снижение заболеваемости корью каким-то образом приводит к снижению уровня браков. Обе переменные независимы.
Современная медицина просто приводит к снижению случаев заболевания корью, и каждый год по разным причинам все меньше людей вступают в брак.
Корреляция между двумя переменными является ложной.
Пример 3: Выпускники средних школ относительно потребления пончиков
Если бы мы каждый год собирали данные об общем количестве выпускников средних школ и общем потреблении пончиков в Соединенных Штатах, мы бы обнаружили, что эти две переменные сильно коррелируют.
Это не означает, что увеличение числа выпускников средних школ приводит к увеличению потребления пончиков в США.
Наиболее вероятное объяснение состоит в том, что население США со временем увеличилось, а это означает, что число людей с дипломом средней школы и общее количество потребляемых пончиков увеличивается по мере увеличения населения.
Это ложная корреляция.
Пример 4: Продажа видеоигр в сравнении с производством атомной энергии
Если бы мы собрали данные об общем объеме продаж видеоигр каждый год во всем мире и общем объеме энергии, производимой атомными электростанциями, мы бы обнаружили, что эти две переменные сильно коррелируют.
Это не означает, что увеличение продаж видеоигр приведет к увеличению производства атомной энергии.
Вместо этого строится больше атомных электростанций и продается больше видеоигр, поскольку население мира увеличивается с каждым годом.
Несмотря на то, что обе переменные постоянно увеличиваются с течением времени, одна не является причиной другой. Корреляция между ними ложна.
Пример 5: Доход от игровых автоматов по сравнению с доходом от игровых автоматов. Работа в угольной шахте
Если мы соберем данные об общем доходе, полученном от игровых автоматов в Соединенных Штатах, и общем количестве рабочих мест в угледобывающей промышленности в Соединенных Штатах, мы обнаружим, что эти две переменные сильно коррелируют.
Это не означает, что одна переменная приводит к уменьшению другой.
Вместо этого с годами аркады и угольные шахты стали менее распространены, что объясняет, почему обе переменные снижались примерно с одинаковой скоростью.
Корреляция между двумя переменными является ложной.
Дополнительные ресурсы
В следующих руководствах представлены реальные примеры других статистических концепций:
Примеры использования вероятности в реальной жизни
Примеры использования корреляции в реальной жизни
Примеры использования среднего, медианы и режима в реальной жизни