Як виконати тест на відповідність хі-квадрат у r


Тест відповідності хі-квадрат використовується для визначення того, чи відповідає категоріальна змінна гіпотетичному розподілу.

У цьому посібнику пояснюється, як виконати тест відповідності хі-квадрат у R.

Приклад: тест відповідності хі-квадрат у R

Власник магазину каже, що кожен день тижня до його магазину приходить однакова кількість покупців. Щоб перевірити цю гіпотезу, дослідник записує кількість покупців, які прийшли в магазин за певний тиждень, і знаходить наступне:

  • Понеділок: 50 клієнтів
  • Вівторок: 60 клієнтів
  • Середа: 40 клієнтів
  • Четвер: 47 клієнтів
  • П’ятниця: 53 клієнтів

Виконайте наступні кроки, щоб виконати тест відповідності хі-квадрат у R, щоб визначити, чи дані відповідають твердженням власника магазину.

Крок 1: Створіть дані.

По-перше, ми створимо дві таблиці, які містять спостережувану частоту та очікувану частку клієнтів для кожного дня:

 observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) #must add up to 1

Крок 2. Виконайте тест на відповідність хі-квадрат.

Далі ми можемо виконати перевірку підгонки хі-квадрат за допомогою функції chisq.test() , яка використовує такий синтаксис:

chisq.test(x, p)

золото:

  • x: числовий вектор спостережуваних частот.
  • p: числовий вектор очікуваних пропорцій.

Наступний код показує, як використовувати цю функцію в нашому прикладі:

 #perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)

	Chi-squared test for given probabilities

data: observed
X-squared = 4.36, df = 4, p-value = 0.3595

Статистичний показник хі-квадрат становить 4,36 , а відповідне значення p — 0,3595 .

Зауважте, що p-значення відповідає значенню хі-квадрат із n-1 ступенями свободи (dof), де n – кількість різних категорій. У цьому випадку df = 5-1 = 4.

Ви можете скористатися калькулятором хі-квадрат для значення P, щоб підтвердити, що значення p, яке відповідає X 2 = 4,36 з df = 4, дорівнює 0,35947 .

Нагадаємо, що тест відповідності хі-квадрат використовує такі нульові та альтернативні гіпотези:

  • H 0 : (нульова гіпотеза) Змінна відповідає гіпотетичному розподілу.
  • H 1 : (альтернативна гіпотеза) Змінна не відповідає гіпотетичному розподілу.

Оскільки p-значення (0,35947) не менше 0,05, ми не можемо відхилити нульову гіпотезу. Це означає, що ми не маємо достатньо доказів, щоб стверджувати, що справжній розподіл клієнтів відрізняється від того, про який повідомляє власник магазину.

Додаткові ресурси

Як виконати тест незалежності хі-квадрат у R
Як обчислити значення P для статистики хі-квадрат у R
Як знайти критичне значення хі-квадрат у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *