Как выполнить критерий согласия хи-квадрат в r
Критерий согласия хи-квадрат используется для определения того, соответствует ли категориальная переменная гипотетическому распределению.
В этом руководстве объясняется, как выполнить критерий согласия хи-квадрат в R.
Пример: критерий согласия хи-квадрат в R
Владелец магазина говорит, что в его магазин каждый день недели приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, исследователь записывает количество покупателей, пришедших в магазин за определенную неделю, и обнаруживает следующее:
- Понедельник: 50 клиентов
- Вторник: 60 клиентов
- Среда: 40 клиентов
- Четверг: 47 клиентов
- Пятница: 53 клиента
Выполните следующие шаги, чтобы выполнить критерий согласия хи-квадрат в R и определить, соответствуют ли данные утверждению владельца магазина.
Шаг 1: Создайте данные.
Сначала мы создадим две таблицы, которые будут содержать наблюдаемые частоты и ожидаемую долю клиентов на каждый день:
observed <- c(50, 60, 40, 47, 53)
expected <- c(.2, .2, .2, .2, .2) #must add up to 1
Шаг 2. Выполните критерий согласия хи-квадрат.
Далее мы можем выполнить тест соответствия хи-квадрат, используя функцию chisq.test() , которая использует следующий синтаксис:
chisq.test(x, p)
Золото:
- x: числовой вектор наблюдаемых частот.
- p: числовой вектор ожидаемых пропорций.
Следующий код показывает, как использовать эту функцию в нашем примере:
#perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)
Chi-squared test for given probabilities
data: observed
X-squared = 4.36, df = 4, p-value = 0.3595
Статистика теста хи-квадрат равна 4,36 , а соответствующее значение p — 0,3595 .
Обратите внимание, что значение p соответствует значению хи-квадрат с n-1 степенями свободы (dof), где n — количество различных категорий. В этом случае df = 5-1 = 4.
Вы можете использовать калькулятор преобразования хи-квадрат в значение P, чтобы подтвердить, что значение p, соответствующее X 2 = 4,36 с df = 4, равно 0,35947 .
Напомним, что критерий согласия хи-квадрат использует следующие нулевые и альтернативные гипотезы:
- H 0 : (нулевая гипотеза) Переменная следует гипотетическому распределению.
- H 1 : (альтернативная гипотеза) Переменная не соответствует гипотетическому распределению.
Поскольку значение p (0,35947) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас недостаточно доказательств, чтобы утверждать, что истинное распределение покупателей отличается от того, о котором сообщает владелец магазина.
Дополнительные ресурсы
Как выполнить тест независимости хи-квадрат в R
Как рассчитать значение P статистики хи-квадрат в R
Как найти критическое значение хи-квадрата в R