Тест на придатність
У цій статті пояснюється, що таке тест на відповідність і для чого він використовується в статистиці. Він також показує, як виконати тест на придатність, і, крім того, ви зможете побачити крок за кроком виконання вправи.
Що таке придатний тест?
Перевірка відповідності – це статистичний тест, який дозволяє нам визначити, чи відповідає вибірка даних певному розподілу ймовірностей . Іншими словами, тест на адекватність використовується для перевірки відповідності спостережуваних даних очікуваним даним.
Часто ми намагаємося спрогнозувати явище, і, як наслідок, ми маємо очікувані значення щодо цього явища, яке, на нашу думку, відбудеться. Однак ми повинні потім зібрати дані та перевірити, чи відповідають зібрані дані нашим очікуванням. Таким чином, тести на адекватність дозволяють нам вирішити за допомогою статистичного критерію, чи схожі очікувані дані та спостережувані дані чи ні.
Таким чином, тест на відповідність є перевіркою гіпотези , нульова гіпотеза якої полягає в тому, що спостережувані значення дорівнюють очікуваним значенням, з іншого боку, альтернативна гіпотеза тесту вказує на те, що спостережувані значення статистично відрізняються від очікуваних значень.
![Rendered by QuickLaTeX.com \begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}](https://statorials.org/wp-content/ql-cache/quicklatex.com-db79847cd8097a2baca298bf82594f4f_l3.png)
У статистиці тест на відповідність також відомий як тест хі-квадрат , оскільки еталонним розподілом тесту є розподіл хі-квадрат.
Формула перевірки відповідності
Статистика тесту на відповідність дорівнює сумі квадратів різниць між спостережуваними значеннями та очікуваними значеннями, поділеним на очікувані значення.
Отже, формула тесту на адекватність має такий вигляд:

золото:
-

це статистика тесту відповідності, яка відповідає розподілу хі-квадрат з

ступенів свободи.
-

це розмір вибірки даних.
-

спостережене значення для даних i.
-

це очікуване значення для даних i.
Таким чином, враховуючи рівень значущості
![]()
, розраховану тестову статистику слід порівняти з критичним тестовим значенням, щоб визначити, чи відхиляти нульову гіпотезу чи альтернативну гіпотезу перевірки гіпотези:
- Якщо тестова статистика менше критичного значення

, альтернативна гіпотеза відхиляється (а нульова гіпотеза приймається).
- Якщо тестова статистика перевищує критичне значення

, нульова гіпотеза відхиляється (а альтернативна гіпотеза приймається).
Як зробити тест на придатність
Щоб виконати тест на придатність, слід виконати наступні кроки:
- Спочатку ми встановимо нульову гіпотезу та альтернативну гіпотезу тесту відповідності.
- По-друге, ми обираємо рівень достовірності , а отже, і рівень значущості тесту на відповідність.
- Далі ми обчислюємо статистику тесту відповідності, формулу для якої можна знайти в розділі вище.
- Ми знаходимо критичне значення критерію відповідності за допомогою таблиці розподілу хі-квадрат.
- Порівнюємо тестову статистику з критичним значенням:
- Якщо тестова статистика менша за критичне значення, альтернативна гіпотеза відхиляється (а нульова гіпотеза приймається).
- Якщо тестова статистика перевищує критичне значення, нульова гіпотеза відхиляється (а альтернативна гіпотеза приймається).
Приклад тесту на адекватність
- Власниця магазину каже, що 50% її продажів припадає на продукт A, 35% її продажів припадає на продукт B, а 15% її продажів припадає на продукт C. Проте продані одиниці кожного продукту — це ті, що вказані в наступну таблицю. Проаналізуйте, чи теоретичні дані власника статистично відрізняються від фактично зібраних даних.
| Продукт | Спостережувані продажі (O i ) |
|---|---|
| Продукт А | 453 |
| Продукт Б | 268 |
| Продукт C | 79 |
| Всього | 800 |
Щоб визначити, чи спостережувані значення еквівалентні очікуваним значенням, ми виконаємо тест на відповідність. Нульова гіпотеза та альтернативна гіпотеза тесту:
![Rendered by QuickLaTeX.com \begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}](https://statorials.org/wp-content/ql-cache/quicklatex.com-db79847cd8097a2baca298bf82594f4f_l3.png)
У цьому випадку ми будемо використовувати рівень достовірності 95% для тесту, тому рівень значущості буде 5%.
![]()
Щоб знайти значення очікуваних продажів, нам потрібно помножити відсоток очікуваних продажів кожного продукту на загальну кількість здійснених продажів:
![Rendered by QuickLaTeX.com \begin{array}{c}E_A=800\cdot 0,50=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-9daef735efca126bba60ccde38423d7b_l3.png)
Тому таблиця частоти проблем виглядає наступним чином:
| Продукт | Спостережувані продажі (O i ) | Очікувані продажі (E i ) |
|---|---|---|
| Продукт А | 453 | 400 |
| Продукт Б | 268 | 280 |
| Продукт C | 79 | 120 |
| Всього | 800 | 800 |
Тепер, коли ми обчислили всі значення, ми застосовуємо формулу хі-квадрат для обчислення тестової статистики:
![Rendered by QuickLaTeX.com \begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-8c76621fbe8504217dfe8ac55b2d6e67_l3.png)
Коли значення тестової статистики обчислено, ми використовуємо таблицю розподілу хі-квадрат, щоб знайти критичне значення тесту. Розподіл хі-квадрат має
![]()
ступенів свободи і рівень значущості
![]()
,Ще:
![Rendered by QuickLaTeX.com \begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-1850e764fc71b1e7b49b0c4d8133ab89_l3.png)
Таким чином, тестова статистика (21,53) більша за критичне тестове значення (5,991), тому нульову гіпотезу відхиляють, а альтернативну гіпотезу приймають. Це означає, що дані дуже відрізняються, і тому власник магазину очікував інших продажів, ніж насправді.
Про автора
Редакція
Привіт, я Бенджамін, професор статистики на пенсії, який став викладачем статистики. Маючи великий досвід і знання в галузі статистики, я готовий поділитися своїми знаннями, щоб розширити можливості студентів через Statorials. Дізнайтеся більше