Как рассчитать значение p статистики хи-квадрат в r


Каждый раз, когда вы выполняете тест хи-квадрат, вы получаете статистику теста хи-квадрат. Затем вы можете найти значение p, соответствующее этой статистике теста, чтобы определить, являются ли результаты теста статистически значимыми или нет.

Чтобы найти значение p, соответствующее статистике теста хи-квадрат в R, вы можете использовать функцию pchisq() , которая использует следующий синтаксис:

pchisq(q, df, low.tail = ИСТИНА)

Золото:

  • q: Статистика теста Хи-квадрат.
  • df: Степени свободы
  • low.tail: если TRUE, возвращается левая вероятность q в распределении хи-квадрат. Если значение FALSE, возвращается вероятность справа от q в распределении хи-квадрат. По умолчанию установлено значение ИСТИНА.

Следующие примеры показывают, как использовать эту функцию на практике.

Пример 1: Критерий согласия хи-квадрат

Владелец магазина говорит, что в его магазин каждый день недели приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, независимый исследователь записывает количество покупателей, пришедших в магазин за определенную неделю, и обнаруживает следующее:

  • Понедельник: 50 клиентов
  • Вторник: 60 клиентов
  • Среда: 40 клиентов
  • Четверг: 47 клиентов
  • Пятница: 53 клиента

Выполнив критерий согласия хи-квадрат , исследователь обнаруживает следующее:

Статистика теста хи-квадрат (X 2 ): 4,36.

Степени свободы: (df): 4

Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:

 #find p-value for the Chi-Square test statistic
pchisq(q=4.36, df=4, lower.tail= FALSE )

[1] 0.3594721

Значение p оказывается равным 0,359 . Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас недостаточно доказательств, чтобы утверждать, что истинное распределение покупателей отличается от того, о котором сообщает владелец магазина.

Пример 2: Критерий независимости по хи-квадрату

Исследователи хотят знать, связан ли пол с предпочтением той или иной политической партии. Они берут простую случайную выборку из 500 избирателей и спрашивают их об их предпочтениях в отношении политических партий. Выполнив критерий независимости хи-квадрат , они обнаружили следующее:

Статистика теста хи-квадрат (X 2 ): 0,8642.

Степени свободы: (df): 2

Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:

 #find p-value for the Chi-Square test statistic
pchisq(q=0.8642, df=2, lower.tail= FALSE )

[1] 0.6491445

Значение p оказывается равным 0,649 . Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что существует связь между полом и предпочтениями политических партий.

Связанный: Как выполнить тест независимости хи-квадрат в R

Полную документацию по функции pchisq() можно найти здесь .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *