Як обчислити значення p для статистики хі-квадрат у r


Щоразу, коли ви виконуєте тест Хі-квадрат, ви отримуватимете статистику тесту Хі-квадрат. Потім ви можете знайти значення p, яке відповідає цій статистиці тесту, щоб визначити, чи є результати тесту статистично значущими чи ні.

Щоб знайти значення p, яке відповідає статистиці тесту Хі-квадрат у R, можна скористатися функцією pchisq() , яка використовує такий синтаксис:

pchisq(q, df, lower.tail = TRUE)

золото:

  • q: Статистика хі-квадрат
  • df: Ступені свободи
  • lower.tail: якщо TRUE, повертається ліва ймовірність q у розподілі хі-квадрат. Якщо FALSE, повертається ймовірність праворуч від q у розподілі хі-квадрат. Типовим значенням є TRUE.

Наступні приклади показують, як використовувати цю функцію на практиці.

Приклад 1: Тест відповідності хі-квадрат

Власник магазину каже, що кожен день тижня до його магазину приходить однакова кількість покупців. Щоб перевірити цю гіпотезу, незалежний дослідник фіксує кількість покупців, які прийшли в магазин за певний тиждень, і знаходить наступне:

  • Понеділок: 50 клієнтів
  • Вівторок: 60 клієнтів
  • Середа: 40 клієнтів
  • Четвер: 47 клієнтів
  • П’ятниця: 53 клієнтів

Після виконання тесту на відповідність хі-квадрат дослідник знаходить наступне:

Статистика хі-квадрат (X 2 ): 4,36

Ступені свободи: (df): 4

Щоб знайти значення p, пов’язане з цією статистикою хі-квадрат і ступенями свободи, ми можемо використати такий код у R:

 #find p-value for the Chi-Square test statistic
pchisq(q=4.36, df=4, lower.tail= FALSE )

[1] 0.3594721

P-значення виявляється рівним 0,359 . Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. Це означає, що ми не маємо достатньо доказів, щоб стверджувати, що справжній розподіл клієнтів відрізняється від того, про який повідомляє власник магазину.

Приклад 2: Тест хі-квадрат незалежності

Дослідники хочуть знати, чи пов’язана стать із перевагами політичної партії. Вони беруть просту випадкову вибірку з 500 виборців і запитують їх про їхні переваги щодо політичної партії. Після виконання тесту хі-квадрат на незалежність вони знаходять наступне:

Статистика хі-квадрат (X 2 ): 0,8642

Ступені свободи: (df): 2

Щоб знайти значення p, пов’язане з цією статистикою хі-квадрат і ступенями свободи, ми можемо використати такий код у R:

 #find p-value for the Chi-Square test statistic
pchisq(q=0.8642, df=2, lower.tail= FALSE )

[1] 0.6491445

P-значення виявляється рівним 0,649 . Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. Це означає, що ми не маємо достатніх доказів, щоб стверджувати, що існує зв’язок між статтю та уподобаннями політичних партій.

Пов’язане: Як виконати тест незалежності хі-квадрат у R

Знайдіть повну документацію для функції pchisq() тут .

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *