Проблема третьої змінної: визначення та приклад
У статистиці проблема третьої змінної виникає, коли спостережувану кореляцію між двома змінними насправді можна пояснити третьою змінною, яка не була врахована.
Якщо ця третя змінна не береться до уваги, кореляція між двома досліджуваними змінними може ввести в оману або навіть призвести до плутанини.
У цьому підручнику наведено кілька прикладів проблем третьої змінної в різних контекстах.
Приклад 1: Собаки та пожежні гідранти
Один дослідник зауважує, що в містах з більшою кількістю пожежних гідрантів також зазвичай більше собак.
Однак ці дві змінні корелюють лише тому, що обидві мають сильну кореляцію з третьою змінною: чисельністю населення .
У великих містах, як правило, більше пожежних гідрантів і більше собак. Навпаки, у менших містах, як правило, менше пожежних гідрантів і менше собак.
Приклад 2: Продажі морозива та напади акул
Дослідник виявив, що продажі морозива та напади акул тісно пов’язані.
Однак ці дві змінні корельовані лише тому, що вони обидві мають сильну кореляцію з третьою змінною: температурою .
Коли тепліше, більше людей купують морозиво і більше людей купаються в океані, що пояснює, чому вартість продажів морозива та нападів акул, як правило, зростає в одну й ту саму пору року.
Приклад 3: Волонтери та стихійні лиха
Дослідження показує, що чим більше волонтерів виступає після стихійного лиха, тим більший збиток.
Однак ці дві змінні корелюють лише тому, що вони обидві мають сильну кореляцію з третьою змінною: масштабом стихійного лиха .
Масштабніші стихійні лиха тісно пов’язані з більшою шкодою, а також збільшенням кількості волонтерів.
Схожі статті
Що таке зміщення пропущеної змінної?
Що таке упередження підрахунку?
Що таке зміщення агрегації?
Що таке незрозуміла змінна?