Інструментальні змінні: визначення та приклади
Часто в статистиці ми прагнемо оцінити вплив однієї змінної на іншу. Наприклад, ми можемо захотіти знати:
- Як час, витрачений на навчання, впливає на результати іспиту?
- Як певний препарат впливає на артеріальний тиск?
- Як стрес впливає на серцевий ритм?
У кожному сценарії ми хочемо зрозуміти, чи впливає змінна прогнозу на змінну відповіді . Однак часто існують інші змінні, які впливають на співвідношення між двома змінними.
Наприклад, припустімо, що ми використовуємо певний препарат як змінну прогностику, а артеріальний тиск – як змінну відповіді. Нас цікавить лише вплив препарату на тиск:
Однак інші змінні, такі як час, проведений заняттями, загальна дієта та рівень стресу, також впливають на артеріальний тиск:
Таким чином, якщо ми виконуємо просту лінійну регресію з використанням препарату як предикторної змінної та артеріального тиску як змінної відповіді, ми не можемо бути впевнені, що коефіцієнти регресії точно відобразять вплив препарату на артеріальний тиск, оскільки зовнішні чинники (вправи, дієта, стрес тощо) також можуть зіграти певну роль.
Одним із потенційних способів вирішення цієї проблеми є використання інструментальної змінної .
Що таке інструментальна змінна?
Інструментальна змінна — це третя змінна, яка вводиться в регресійний аналіз і корелюється зі змінною предиктора, але не корелюється зі змінною відповіді. Використовуючи цю змінну, стає можливим оцінити справжній причинно-наслідковий ефект, який має предикторна змінна на змінну відповіді.
Наприклад, припустімо, що ми хочемо оцінити вплив певного препарату на артеріальний тиск:
Прикладом інструментальної змінної, яку ми можемо використовувати в цьому регресійному аналізі, є близькість людини до аптеки.
Ця змінна «близькості», ймовірно, сильно корелює з тим, чи приймає особа відповідний препарат, оскільки людина не зможе його отримати, якщо вона не живе поблизу аптеки.
Однак змінна «близькість» не повинна мати жодної кореляції з артеріальним тиском. Єдиний зв’язок, який він мав би з кров’яним тиском, – це змінна предиктора.
Те, як ми фактично використовуємо інструментальну змінну, полягає в виконанні регресії інструментальної змінної, яку іноді називають двоетапною регресією найменших квадратів .
Регресія інструментальних змінних
Інструментальна регресія змінних (або двоетапна регресія найменших квадратів) використовує наступний підхід для оцінки впливу предикторної змінної на змінну відповіді:
Крок 1. Підберіть регресійну модель, використовуючи інструментальну змінну як змінну-прогноз.
У нашому конкретному прикладі ми спочатку підібрали б таку модель регресії:
Певні ліки = B 0 + B 1 (близькість)
Тоді ми залишимо прогнозовані значення для певних ліків (cd), які ми назвемо cd hat .
Крок 2. Підберіть другу модель регресії, використовуючи прогнозовані значення для cd hat .
Далі ми підберемо таку модель регресії:
Артеріальний тиск = B 0 + B 1 (cd hat )
Якщо коефіцієнт регресії cd hat виявляється статистично значущим, то можна сказати, що існує причинно-наслідковий вплив препарату на артеріальний тиск.
Причина, по якій ми можемо це сказати, полягає в тому, що ми використовували лише термін «близькість» для створення CD Hat , і ми знаємо, що близькість не повинна корелюватися з артеріальним тиском, будь-яка значна кореляція на другій стадії регресії може бути пов’язана з певним препаратом.
Застереження щодо використання інструментальних змінних
Інструментальну змінну слід використовувати, лише якщо вона відповідає таким критеріям:
- Це сильно корелює з прогностичною змінною.
- Це не корелюється зі змінною відповіді.
- Це не корелює з іншими змінними, виключеними з моделі (наприклад, близькість не корелює з фізичними вправами, дієтою чи стресом).
Якщо інструментальна змінна не відповідає цьому критерію, її не слід використовувати в регресійній моделі, оскільки вона, ймовірно, дасть ненадійні та упереджені результати.