Тест незалежності хі-квадрат: визначення, формула та приклад
Тест хі-квадрат незалежності використовується, щоб визначити, чи існує значний зв’язок між двома категоріальними змінними.
Цей посібник пояснює наступне:
- Мотивація виконання тесту хі-квадрат незалежності.
- Формула для виконання тесту хі-квадрат незалежності.
- Приклад того, як виконати тест незалежності хі-квадрат.
Тест незалежності хі-квадрат: мотивація
Тест хі-квадрат незалежності можна використовувати, щоб визначити, чи існує зв’язок між двома категоріальними змінними в багатьох різних контекстах. Ось кілька прикладів:
- Ми хочемо знати, чи стать пов’язана з перевагою політичної партії. Тож ми опитуємо 500 виборців і фіксуємо їхню стать та переваги щодо політичних партій.
- Ми хочемо знати, чи асоціюється улюблений колір людини з її улюбленим видом спорту. Тож ми опитуємо 100 людей і запитуємо їх, які їхні переваги щодо обох.
- Ми хочемо знати, чи пов’язані рівень освіти та сімейний стан. Тому ми збираємо дані щодо цих двох змінних на простій випадковій вибірці з 50 осіб.
У кожному з цих сценаріїв ми хочемо знати, чи дві категоріальні змінні пов’язані одна з одною. У кожному сценарії ми можемо використовувати тест хі-квадрат незалежності, щоб визначити, чи існує статистично значущий зв’язок між змінними.
Тест незалежності хі-квадрат: формула
Тест хі-квадрат на незалежність використовує такі нульові та альтернативні гіпотези:
- H 0 : (нульова гіпотеза) Дві змінні є незалежними.
- H 1 : (альтернативна гіпотеза) Ці дві змінні не є незалежними. (тобто вони пов’язані)
Ми використовуємо наступну формулу для розрахунку тестової статистики хі-квадрат x 2 :
X 2 = Σ(OE) 2 / E
золото:
- Σ: химерний символ, що означає «сума»
- O: спостережуване значення
- E: очікуване значення
Якщо p-значення, яке відповідає тестовій статистиці X 2 зі ступенями свободи (#rows-1)*(#columns-1), менше вибраного рівня значущості, ви можете відхилити нульову гіпотезу.
Тест на незалежність хі-квадрат: приклад
Припустімо, ми хочемо знати, чи пов’язана стать із перевагами політичної партії. Ми беремо просту випадкову вибірку з 500 виборців і запитуємо їх про їхні переваги щодо політичної партії. У наступній таблиці представлені результати опитування:
республіканець | демократ | Незалежний | Всього | |
Чоловік | 120 | 90 | 40 | 250 |
Жінка | 110 | 95 | 45 | 250 |
Всього | 230 | 185 | 85 | 500 |
Виконайте наступні кроки, щоб виконати тест хі-квадрат незалежності, щоб визначити, чи стать пов’язана з уподобаннями до політичних партій.
Крок 1: Визначте припущення.
Ми виконаємо тест незалежності хі-квадрат, використовуючи такі припущення:
- H 0 : Уподобання щодо статі та політичних партій не залежать.
- H 1 : Уподобання статі та політичних партій не є незалежними.
Крок 2: Обчисліть очікувані значення.
Далі ми обчислимо очікувані значення для кожної комірки в таблиці непередбачуваності за такою формулою:
Очікуване значення = (сума рядків * сума стовпців) / сума таблиці.
Наприклад, очікуване значення для чоловіків-республіканців таке: (230*250) / 500 = 115 .
Ми можемо повторити цю формулу, щоб отримати очікуване значення для кожної клітинки таблиці:
республіканець | демократ | Незалежний | Всього | |
Чоловік | 115 | 92.5 | 42.5 | 250 |
Жінка | 115 | 92.5 | 42.5 | 250 |
Всього | 230 | 185 | 85 | 500 |
Крок 3: обчисліть (OE) 2 /E для кожної клітинки таблиці.
Далі ми розрахуємо (OE) 2 /E для кожної клітинки таблиці, де:
- O: спостережуване значення
- E: очікуване значення
Наприклад, чоловіки-республіканці матимуть значення: (120-115) 2 /115 = 0,2174 .
Ми можемо повторити цю формулу для кожної клітинки таблиці:
республіканець | демократ | Незалежний | |
Чоловік | 0,2174 | 0,0676 | 0,1471 |
Жінка | 0,2174 | 0,0676 | 0,1471 |
Крок 4: Обчисліть тестову статистику X2 і відповідне значення p.
X 2 = σ (OE) 2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642
Згідно з калькулятором оцінки хі-квадрат до значення P , значення p, пов’язане з X 2 = 0,8642 і (2-1)*(3-1) = 2 ступенями свободи, становить 0,649198 .
Крок 5: Зробіть висновок.
Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. Це означає, що ми не маємо достатніх доказів, щоб стверджувати, що існує зв’язок між статтю та уподобаннями політичних партій.
Примітка. Ви також можете виконати весь цей тест, просто використовуючи калькулятор тесту незалежності хі-квадрат .
Додаткові ресурси
У наступних посібниках пояснюється, як виконати тест хі-квадрат незалежності за допомогою різних статистичних програм:
Як виконати тест хі-квадрат незалежності в Stata
Як виконати тест незалежності хі-квадрат в Excel
Як виконати тест незалежності хі-квадрат у SPSS
Як виконати тест незалежності хі-квадрат у Python
Як виконати тест незалежності хі-квадрат у R
Перевірка незалежності хі-квадрат на калькуляторі TI-84
Калькулятор тесту хі-квадрат незалежності