Как выполнить критерий согласия хи-квадрат в python


Критерий согласия хи-квадрат используется для определения того, соответствует ли категориальная переменная гипотетическому распределению.

В этом руководстве объясняется, как выполнить критерий согласия хи-квадрат в Python.

Пример: критерий согласия хи-квадрат в Python

Владелец магазина говорит, что в его магазин каждый день недели приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, исследователь записывает количество покупателей, пришедших в магазин за определенную неделю, и обнаруживает следующее:

  • Понедельник: 50 клиентов
  • Вторник: 60 клиентов
  • Среда: 40 клиентов
  • Четверг: 47 клиентов
  • Пятница: 53 клиента

Используйте следующие шаги, чтобы выполнить тест соответствия хи-квадрат в Python, чтобы определить, соответствуют ли данные утверждению владельца магазина.

Шаг 1: Создайте данные.

Сначала мы создадим две таблицы, которые будут содержать наблюдаемое и ожидаемое количество клиентов на каждый день:

 expected = [50, 50, 50, 50, 50]
observed = [50, 60, 40, 47, 53]

Шаг 2. Выполните критерий согласия хи-квадрат.

Далее мы можем выполнить тест на соответствие хи-квадрат, используя функцию хи-квадрат из библиотеки SciPy, которая использует следующий синтаксис:

Хи-квадрат (f_obs, f_exp)

Золото:

  • f_obs: массив наблюдаемых значений.
  • f_exp: массив ожидаемых значений. По умолчанию каждая категория считается равновероятной.

Следующий код показывает, как использовать эту функцию в нашем конкретном примере:

 import scipy.stats as stats

#perform Chi-Square Goodness of Fit Test
stats.chisquare(f_obs=observed, f_exp=expected)

(statistic=4.36, pvalue=0.35947)

Статистика теста хи-квадрат равна 4,36 , а соответствующее значение p — 0,35947 .

Обратите внимание, что значение p соответствует значению хи-квадрат с n-1 степенями свободы (dof), где n — количество различных категорий. В этом случае dof = 5-1 = 4. Вы можете использовать калькулятор хи-квадрат для P-значения , чтобы подтвердить, что значение p, соответствующее X 2 = 4,36 с dof = 4, равно 0,35947 .

Напомним, что критерий согласия хи-квадрат использует следующие нулевые и альтернативные гипотезы:

  • H 0 : (нулевая гипотеза) Переменная следует гипотетическому распределению.
  • H 1 : (альтернативная гипотеза) Переменная не соответствует гипотетическому распределению.

Поскольку значение p (0,35947) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас недостаточно доказательств, чтобы утверждать, что истинное распределение покупателей отличается от того, о котором сообщает владелец магазина.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *