Корреляция не предполагает причинно-следственной связи: 5 конкретных примеров
Фраза « корреляция не подразумевает причинно-следственную связь » часто используется в статистике, чтобы подчеркнуть, что корреляция между двумя переменными не обязательно означает, что одна переменная является причиной другой.
Чтобы лучше понять это выражение, рассмотрим следующие конкретные примеры.
Пример 1: Продажа мороженого и нападения акул
Если бы мы каждый год собирали данные о ежемесячных продажах мороженого и ежемесячных нападениях акул в Соединенных Штатах, мы бы обнаружили, что эти две переменные сильно коррелируют.
Означает ли это, что употребление мороженого вызывает нападение акул?
Недостаточно. Наиболее вероятное объяснение заключается в том, что больше людей потребляют мороженое и купаются в океане, когда на улице теплее, что объясняет, почему эти две переменные так сильно коррелируют.
Хотя продажи мороженого и нападения акул тесно связаны, одно не является причиной другого.
Пример 2: Мастерство и кассовые сборы
Если мы соберем данные об общем количестве степеней магистра, присуждаемых университетами каждый год, и общих кассовых сборах, полученных за год, мы обнаружим, что эти две переменные сильно коррелируют.
Означает ли это, что выдача большего количества степеней магистра приводит к ежегодному увеличению кассовых сборов?
Недостаточно. Наиболее вероятное объяснение состоит в том, что население мира увеличивается с каждым годом, а это означает, что каждый год присуждается больше степеней магистра, и количество людей, идущих в кино, каждый год увеличивается примерно в равных пропорциях.
Хотя эти две переменные коррелируют, одна не является причиной другой.
Пример 3: утопление в бассейнах в связи с производством атомной энергии
Если бы мы собирали данные об общем количестве утонувших в бассейне каждый год и общем количестве энергии, ежегодно производимой атомными электростанциями, мы бы обнаружили, что эти две переменные сильно коррелируют.
Означает ли это, что увеличение числа случаев утопления в плавательных бассейнах каким-то образом приводит к увеличению производства ядерной энергии?
Не совсем. Наиболее вероятное объяснение состоит в том, что население мира увеличилось, а это означает, что все больше людей тонут в бассейнах, а производство атомной энергии с каждым годом становится все более жизнеспособным, поэтому оно и увеличивается.
Хотя эти две переменные тесно взаимосвязаны, одна не является причиной другой.
Пример 4: Случаи кори в зависимости от уровня брака
Если бы мы каждый год собирали данные об общем количестве случаев кори в Соединенных Штатах и уровне брака, мы бы обнаружили, что эти две переменные сильно коррелируют.
Означает ли это, что меньшее количество случаев кори приводит к снижению уровня брака?
Не совсем. Вместо этого две переменные независимы: современная медицина приводит к снижению случаев заболевания корью, и каждый год по разным причинам все меньше людей вступают в брак.
Хотя эти две переменные тесно коррелируют, одна не является причиной другой.
Пример 5: Выпускники средних школ относительно потребления пиццы
Если бы мы каждый год собирали данные об общем количестве выпускников средних школ и общем потреблении пиццы в Соединенных Штатах, мы бы обнаружили, что эти две переменные сильно коррелируют.
Означает ли это, что увеличение числа выпускников средних школ приводит к увеличению потребления пиццы в Соединенных Штатах?
Недостаточно. Наиболее вероятное объяснение состоит в том, что население США со временем увеличилось, а это означает, что число людей с дипломом средней школы и общее количество потребляемой пиццы увеличивается по мере увеличения населения.
Хотя эти две переменные коррелируют, одна не является причиной другой.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о корреляции:
Введение в коэффициент корреляции Пирсона
Означает ли причинно-следственная связь корреляцию?
Корреляция против. ассоциация: в чем разница?
Что считается «сильной» корреляцией?
Когда следует использовать корреляцию?