Задача с третьей переменной: определение и пример
В статистике проблема третьей переменной возникает, когда наблюдаемая корреляция между двумя переменными на самом деле может быть объяснена третьей переменной, которая не была принята во внимание.
Если эта третья переменная не принимается во внимание, корреляция между двумя изучаемыми переменными может ввести в заблуждение или даже привести к путанице.
В этом руководстве представлено несколько примеров проблем с третьей переменной в разных контекстах.
Пример 1: Собаки и пожарные гидранты
Один исследователь заметил, что в городах с большим количеством пожарных гидрантов также, как правило, больше собак.
Однако эти две переменные коррелируют только потому, что они обе имеют сильную корреляцию с третьей переменной: численностью населения .
В крупных городах, как правило, больше пожарных гидрантов и больше собак. И наоборот, в небольших городах, как правило, меньше пожарных гидрантов и меньше собак.
Пример 2: Продажа мороженого и нападения акул
Исследователь обнаружил, что продажи мороженого и нападения акул тесно связаны между собой.
Однако эти две переменные коррелируют только потому, что они обе имеют сильную корреляцию с третьей переменной: температурой .
Когда становится теплее, больше людей покупают мороженое и больше людей купаются в океане, что объясняет, почему объемы продаж мороженого и нападений акул имеют тенденцию увеличиваться в одно и то же время года.
Пример 3: Добровольцы и стихийные бедствия
Исследование показало, что чем больше добровольцев откликаются на стихийное бедствие, тем больше ущерб.
Однако эти две переменные коррелируют только потому, что они обе имеют сильную корреляцию с третьей переменной: масштабом стихийного бедствия .
Более крупные стихийные бедствия тесно связаны с большим причиненным ущербом, а также с увеличением числа добровольцев.
Статьи по Теме
Что такое смещение пропущенной переменной?
Что такое смещение занижения?
Что такое смещение агрегирования?
Что такое сбивающая с толку переменная?