Скрытые переменные: определение и примеры
Скрытая переменная — это переменная, которая не включается в статистический анализ, но влияет на взаимосвязь между двумя переменными в рамках анализа.
Скрытая переменная может скрыть истинную связь между переменными или может создать ложное впечатление, что между переменными существует связь. По сути, скрытые переменные могут ввести в заблуждение результаты исследования.
В наблюдательных исследованиях важно осознавать, что скрытые переменные могут привести к необычной интерпретации данных и взаимосвязей между переменными. В экспериментальных исследованиях важно спланировать эксперимент таким образом, чтобы исключить (насколько это возможно) риск скрытых переменных.
Примеры скрытых переменных
Следующие примеры иллюстрируют несколько случаев, когда в исследовании могут присутствовать скрытые переменные:
Пример 1
Исследователь обнаружил, что продажи мороженого и нападения акул тесно связаны между собой. Означает ли это, что увеличение продаж мороженого приводит к увеличению количества нападений акул?
Это маловероятно. Наиболее вероятной причиной является переменчивая погода . Когда на улице теплее, больше людей покупают мороженое и больше людей отправляются на океан.
Пример 2
Исследователь обнаружил, что потребление попкорна и количество дорожно-транспортных происшествий на протяжении многих лет тесно связаны. Означает ли это, что более высокое потребление попкорна приводит к большему количеству дорожно-транспортных происшествий?
Это маловероятно. Наиболее вероятной причиной является переменная скрывающаяся популяция . По мере увеличения населения увеличивается количество потребляемого попкорна и количество дорожно-транспортных происшествий.
Пример 3
Исследование показало, что чем больше добровольцев откликаются на стихийное бедствие, тем больше ущерб. Означает ли это, что волонтеры наносят больший ущерб?
Это маловероятно. Наиболее вероятной причиной является различный масштаб стихийного бедствия . Более крупное стихийное бедствие приводит к увеличению количества добровольцев, а также к увеличению размера ущерба, причиненного стихийным бедствием.
Пример 4
Исследование показало, что продажи перчаток и несчастные случаи на сноуборде тесно связаны. Означает ли это, что перчатки становятся причиной большего количества несчастных случаев на сноуборде?
Это маловероятно. Наиболее вероятной причиной является скрытая переменная температура . По мере того, как температура падает, все больше и больше людей покупают перчатки и все больше и больше людей катаются на сноуборде.
Как идентифицировать скрытые переменные
Чтобы обнаружить скрытые переменные, полезно иметь опыт в изучаемой области. Зная, какие потенциальные переменные могут повлиять на взаимосвязь между переменными исследования, которые явно не включены в исследование, вы сможете обнаружить потенциальные скрытые переменные.
Другой способ выявить потенциальные скрытые переменные — изучить графики остатков. Если в остатках наблюдается тенденция (линейная или нелинейная), это может означать, что скрытая переменная, не включенная в исследование, каким-то образом влияет на переменные исследования.
Как устранить риск скрытых переменных
В наблюдательных исследованиях может быть очень сложно исключить риск скрытых переменных. В большинстве случаев лучшее, что вы можете сделать, — это просто выявить, а не предотвратить потенциальные скрытые переменные, которые могут повлиять на исследование.
Однако в экспериментальных исследованиях влияние скрытых переменных можно в значительной степени устранить за счет хорошего планирования эксперимента.
Например, предположим, что мы хотим знать, оказывают ли две таблетки разное влияние на кровяное давление. Мы знаем, что скрытые переменные, такие как диета и привычка курить, также влияют на артериальное давление. Поэтому мы можем попытаться контролировать эти скрытые переменные, используя рандомизированный план . Это означает, что мы случайным образом назначаем пациентов для приема первой или второй таблетки.
Поскольку мы случайным образом распределяем пациентов по группам, можно предположить, что скрытые переменные повлияют на обе группы примерно одинаково. Это означает, что любая разница в артериальном давлении может быть связана с приемом таблетки, а не с эффектом скрытой переменной.