Як виконати тест на незалежність хі-квадрат у python
Тест хі-квадрат на незалежність використовується для визначення того, чи існує значущий зв’язок між двома категоріальними змінними.
Цей посібник пояснює, як виконати тест незалежності хі-квадрат у Python.
Приклад: тест незалежності хі-квадрат у Python
Припустімо, ми хочемо знати, чи пов’язана стать із перевагами політичної партії. Ми беремо просту випадкову вибірку з 500 виборців і запитуємо їх про їхні переваги щодо політичної партії. У наступній таблиці представлені результати опитування:
республіканець | демократ | Незалежний | Всього | |
Чоловік | 120 | 90 | 40 | 250 |
Жінка | 110 | 95 | 45 | 250 |
Всього | 230 | 185 | 85 | 500 |
Виконайте наступні кроки, щоб виконати тест незалежності хі-квадрат у Python, щоб визначити, чи пов’язана стать із перевагами політичної партії.
Крок 1: Створіть дані.
Спочатку ми створимо таблицю для зберігання наших даних:
data = [[120, 90, 40], [110, 95, 45]]
Крок 2. Виконайте тест незалежності хі-квадрат.
Далі ми можемо виконати тест на незалежність хі-квадрат за допомогою функції chi2_contingency з бібліотеки SciPy, яка використовує такий синтаксис:
chi2_contingency (спостерігається)
золото:
- спостерігається: таблиця непередбачуваності спостережуваних значень.
Наступний код показує, як використовувати цю функцію в нашому прикладі:
import scipy.stats as stats #perform the Chi-Square Test of Independence stats.chi2_contingency(data) (0.864, 0.649, 2, array([[115. , 92.5, 42.5], [115. , 92.5, 42.5]]))
Спосіб інтерпретації результату такий:
- Статистика хі-квадрат: 0,864
- р-значення: 0,649
- Ступені свободи: 2 (обчислюється як #рядки-1 * #стовпці-1)
- Таблиця: остання таблиця відображає очікувані значення для кожної комірки в таблиці непередбачених обставин.
Нагадаємо, що тест незалежності хі-квадрат використовує такі нульові та альтернативні гіпотези:
- H 0 : (нульова гіпотеза) Дві змінні є незалежними.
- H 1 : (альтернативна гіпотеза) Ці дві змінні не є незалежними.
Оскільки p-значення (0,649) тесту не менше 0,05, ми не можемо відхилити нульову гіпотезу. Це означає, що ми не маємо достатніх доказів, щоб стверджувати, що існує зв’язок між статтю та уподобаннями політичних партій.
Іншими словами, уподобання статі та політичних партій є незалежними.