Тест хі-квадрат

У цій статті пояснюється, що таке тест хі-квадрат у статистиці та для чого він використовується. Ви також дізнаєтесь, як виконати тест хі-квадрат, а також розв’яжете вправу крок за кроком.

Що таке тест хі-квадрат?

Критерій хі-квадрат — це статистичний тест, який використовується для визначення наявності статистично значущої різниці між очікуваною та спостережуваною частотами.

Логічно, статистика хі-квадрат відповідає розподілу хі-квадрат . Тому значення тестової статистики необхідно порівнювати з певним значенням розподілу хі-квадрат. Нижче ми побачимо, як виконується тест хі-квадрат.

Цей тип статистичного тесту також відомий як тест Пірсона хі-квадрат і іноді позначається символом розподілу хі-квадрат: критерій χ² .

Формула хі-квадрат

Статистика тесту хі-квадрат дорівнює сумі квадратів різниць між спостережуваними значеннями та очікуваними значеннями, поділеним на очікувані значення.

Отже, формула тесту хі-квадрат така:

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

золото:

  • \chi^2

    це статистика тесту хі-квадрат, яка відповідає розподілу хі-квадрат з

    k-1

    ступенів свободи.

  • k

    це розмір вибірки даних.

  • O_i

    спостережене значення для даних i.

  • E_i

    це очікуване значення для даних i.

Нульова гіпотеза перевірки гіпотези за допомогою тесту хі-квадрат полягає в тому, що спостережувані значення еквівалентні очікуваним значенням. З іншого боку, альтернативна гіпотеза тесту полягає в тому, що одне з спостережуваних значень відрізняється від його очікуваного значення.

\begin{cases}H_0:O_i=E_i \quad \forall i\\[2ex]H_1:\exists \ O_i\neq E_i \end{cases}

Отже, враховуючи рівень значущості

\alpha

, розраховану тестову статистику слід порівняти з критичним тестовим значенням, щоб визначити, чи відхиляти нульову гіпотезу чи альтернативну гіпотезу:

  • Якщо тестова статистика менше критичного значення

    \chi_{1-\alpha|k-1}^2

    , альтернативна гіпотеза відхиляється (а нульова гіпотеза приймається).

  • Якщо тестова статистика перевищує критичне значення

    \chi_{1-\alpha|k-1}^2

    , нульова гіпотеза відхиляється (а альтернативна гіпотеза приймається).

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}” title=”Rendered by QuickLaTeX.com” height=”70″ width=”243″ style=”vertical-align: 0px;”></p>
</p>
<h2 class= Приклад тесту хі-квадрат

Після того, як ми побачили визначення тесту хі-квадрат і його формулу, нижче наведено покроковий приклад, щоб ви могли побачити, як виконується цей тип статистичного тесту.

  • Власник магазину каже, що 50% його продажів припадає на продукт A, 35% його продажів припадає на продукт B, а 15% його продажів припадає на продукт C. Проте продані одиниці кожного продукту — це ті, які вони представлені у наступній таблиці непередбачених обставин . Проаналізуйте, чи теоретичні дані власника статистично відрізняються від фактично зібраних даних.
Продукт Спостережувані продажі (O i )
Продукт А 453
Продукт Б 268
Продукт C 79
Всього 800

Спочатку нам потрібно розрахувати значення, очікувані власником магазину. Для цього ми множимо відсоток очікуваних продажів кожного продукту на кількість досягнутих загальних продажів:

\begin{array}{c}E_A=800\cdot 0,5=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

Отже, частотна таблиця розподілу задачі має такий вигляд:

Продукт Спостережувані продажі (O i ) Очікувані продажі (E i )
Продукт А 453 400
Продукт Б 268 280
Продукт C 79 120
Всього 800 800

Тепер, коли ми обчислили всі значення, ми застосовуємо формулу хі-квадрат для обчислення тестової статистики:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

Коли значення тестової статистики обчислено, ми використовуємо таблицю розподілу хі-квадрат, щоб знайти критичне значення тесту. Розподіл хі-квадрат має

k-1=3-1=2

ступенів свободи, тому якщо ми виберемо рівень значущості

\alpha=0,05

критичне значення тесту таке:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

Таким чином, тестова статистика (21,53) більша за критичне тестове значення (5,991), отже, нульова гіпотеза відхиляється, а альтернативна гіпотеза приймається. Це означає, що дані дуже відрізняються, і тому власник магазину очікував інших продажів, ніж насправді.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=”Rendered by QuickLaTeX.com” height=”17″ width=”354″ style=”vertical-align: -4px;”></p>
</p>
<h2 class= Інтерпретація тесту хі-квадрат

Інтерпретація тесту Хі-квадрат не може бути виконана виключно на основі отриманого результату тесту, його необхідно порівняти з критичним значенням тесту.

Логічно, чим менше значення обчисленої тестової статистики, тим більше подібні спостережувані дані до очікуваних даних. Отже, якщо результат тесту хі-квадрат дорівнює 0, це означає, що спостережувані значення та очікувані значення абсолютно однакові. З іншого боку, чим вищий результат тесту, це означає, що більше спостережувані значення відрізняються від очікуваних.

Однак, щоб вирішити, чи є два набори даних статистично різними чи рівними, необхідно порівняти обчислене тестове значення з критичним тестовим значенням, щоб відхилити нульову гіпотезу або альтернативну гіпотезу контрасту. Якщо тестова статистика менша за критичне значення розподілу, альтернативна гіпотеза відхиляється. З іншого боку, якщо тестова статистика перевищує критичне значення розподілу, нульову гіпотезу відхиляють.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *