Как рассчитать значение p статистики хи-квадрат в r
Каждый раз, когда вы выполняете тест хи-квадрат, вы получаете статистику теста хи-квадрат. Затем вы можете найти значение p, соответствующее этой статистике теста, чтобы определить, являются ли результаты теста статистически значимыми или нет.
Чтобы найти значение p, соответствующее статистике теста хи-квадрат в R, вы можете использовать функцию pchisq() , которая использует следующий синтаксис:
pchisq(q, df, low.tail = ИСТИНА)
Золото:
- q: Статистика теста Хи-квадрат.
- df: Степени свободы
- low.tail: если TRUE, возвращается левая вероятность q в распределении хи-квадрат. Если значение FALSE, возвращается вероятность справа от q в распределении хи-квадрат. По умолчанию установлено значение ИСТИНА.
Следующие примеры показывают, как использовать эту функцию на практике.
Пример 1: Критерий согласия хи-квадрат
Владелец магазина говорит, что в его магазин каждый день недели приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, независимый исследователь записывает количество покупателей, пришедших в магазин за определенную неделю, и обнаруживает следующее:
- Понедельник: 50 клиентов
- Вторник: 60 клиентов
- Среда: 40 клиентов
- Четверг: 47 клиентов
- Пятница: 53 клиента
Выполнив критерий согласия хи-квадрат , исследователь обнаруживает следующее:
Статистика теста хи-квадрат (X 2 ): 4,36.
Степени свободы: (df): 4
Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:
#find p-value for the Chi-Square test statistic pchisq(q=4.36, df=4, lower.tail= FALSE ) [1] 0.3594721
Значение p оказывается равным 0,359 . Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас недостаточно доказательств, чтобы утверждать, что истинное распределение покупателей отличается от того, о котором сообщает владелец магазина.
Пример 2: Критерий независимости по хи-квадрату
Исследователи хотят знать, связан ли пол с предпочтением той или иной политической партии. Они берут простую случайную выборку из 500 избирателей и спрашивают их об их предпочтениях в отношении политических партий. Выполнив критерий независимости хи-квадрат , они обнаружили следующее:
Статистика теста хи-квадрат (X 2 ): 0,8642.
Степени свободы: (df): 2
Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:
#find p-value for the Chi-Square test statistic pchisq(q=0.8642, df=2, lower.tail= FALSE ) [1] 0.6491445
Значение p оказывается равным 0,649 . Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что существует связь между полом и предпочтениями политических партий.
Связанный: Как выполнить тест независимости хи-квадрат в R
Полную документацию по функции pchisq() можно найти здесь .