Як виконати тест на незалежність хі-квадрат у python


Тест хі-квадрат на незалежність   використовується для визначення того, чи існує значущий зв’язок між двома категоріальними змінними.

Цей посібник пояснює, як виконати тест незалежності хі-квадрат у Python.

Приклад: тест незалежності хі-квадрат у Python

Припустімо, ми хочемо знати, чи пов’язана стать із перевагами політичної партії. Ми беремо просту випадкову вибірку з 500 виборців і запитуємо їх про їхні переваги щодо політичної партії. У наступній таблиці представлені результати опитування:

республіканець демократ Незалежний Всього
Чоловік 120 90 40 250
Жінка 110 95 45 250
Всього 230 185 85 500

Виконайте наступні кроки, щоб виконати тест незалежності хі-квадрат у Python, щоб визначити, чи пов’язана стать із перевагами політичної партії.

Крок 1: Створіть дані.

Спочатку ми створимо таблицю для зберігання наших даних:

 data = [[120, 90, 40],
        [110, 95, 45]]

Крок 2. Виконайте тест незалежності хі-квадрат.

Далі ми можемо виконати тест на незалежність хі-квадрат за допомогою функції chi2_contingency з бібліотеки SciPy, яка використовує такий синтаксис:

chi2_contingency (спостерігається)

золото:

  • спостерігається: таблиця непередбачуваності спостережуваних значень.

Наступний код показує, як використовувати цю функцію в нашому прикладі:

 import scipy.stats as stats

#perform the Chi-Square Test of Independence
stats.chi2_contingency(data)

(0.864,
 0.649,
 2,
 array([[115. , 92.5, 42.5],
        [115. , 92.5, 42.5]]))

Спосіб інтерпретації результату такий:

  • Статистика хі-квадрат: 0,864
  • р-значення: 0,649
  • Ступені свободи: 2 (обчислюється як #рядки-1 * #стовпці-1)
  • Таблиця: остання таблиця відображає очікувані значення для кожної комірки в таблиці непередбачених обставин.

Нагадаємо, що тест незалежності хі-квадрат використовує такі нульові та альтернативні гіпотези:

  • H 0 : (нульова гіпотеза) Дві змінні є незалежними.
  • H 1 : (альтернативна гіпотеза) Ці дві змінні не є незалежними.

Оскільки p-значення (0,649) тесту не менше 0,05, ми не можемо відхилити нульову гіпотезу. Це означає, що ми не маємо достатніх доказів, щоб стверджувати, що існує зв’язок між статтю та уподобаннями політичних партій.

Іншими словами, уподобання статі та політичних партій є незалежними.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *