Тест на придатність

У цій статті пояснюється, що таке тест на відповідність і для чого він використовується в статистиці. Він також показує, як виконати тест на придатність, і, крім того, ви зможете побачити крок за кроком виконання вправи.

Що таке придатний тест?

Перевірка відповідності – це статистичний тест, який дозволяє нам визначити, чи відповідає вибірка даних певному розподілу ймовірностей . Іншими словами, тест на адекватність використовується для перевірки відповідності спостережуваних даних очікуваним даним.

Часто ми намагаємося спрогнозувати явище, і, як наслідок, ми маємо очікувані значення щодо цього явища, яке, на нашу думку, відбудеться. Однак ми повинні потім зібрати дані та перевірити, чи відповідають зібрані дані нашим очікуванням. Таким чином, тести на адекватність дозволяють нам вирішити за допомогою статистичного критерію, чи схожі очікувані дані та спостережувані дані чи ні.

Таким чином, тест на відповідність є перевіркою гіпотези , нульова гіпотеза якої полягає в тому, що спостережувані значення дорівнюють очікуваним значенням, з іншого боку, альтернативна гіпотеза тесту вказує на те, що спостережувані значення статистично відрізняються від очікуваних значень.

\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}

У статистиці тест на відповідність також відомий як тест хі-квадрат , оскільки еталонним розподілом тесту є розподіл хі-квадрат.

Формула перевірки відповідності

Статистика тесту на відповідність дорівнює сумі квадратів різниць між спостережуваними значеннями та очікуваними значеннями, поділеним на очікувані значення.

Отже, формула тесту на адекватність має такий вигляд:

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

золото:

  • \chi^2

    це статистика тесту відповідності, яка відповідає розподілу хі-квадрат з

    k-1

    ступенів свободи.

  • k

    це розмір вибірки даних.

  • O_i

    спостережене значення для даних i.

  • E_i

    це очікуване значення для даних i.

Таким чином, враховуючи рівень значущості

\alpha

, розраховану тестову статистику слід порівняти з критичним тестовим значенням, щоб визначити, чи відхиляти нульову гіпотезу чи альтернативну гіпотезу перевірки гіпотези:

  • Якщо тестова статистика менше критичного значення

    \chi_{1-\alpha|k-1}^2

    , альтернативна гіпотеза відхиляється (а нульова гіпотеза приймається).

  • Якщо тестова статистика перевищує критичне значення

    \chi_{1-\alpha|k-1}^2

    , нульова гіпотеза відхиляється (а альтернативна гіпотеза приймається).

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}” title=”Rendered by QuickLaTeX.com” height=”70″ width=”243″ style=”vertical-align: 0px;”></p>
</p>
<h2 class= Як зробити тест на придатність

Щоб виконати тест на придатність, слід виконати наступні кроки:

  1. Спочатку ми встановимо нульову гіпотезу та альтернативну гіпотезу тесту відповідності.
  2. По-друге, ми обираємо рівень достовірності , а отже, і рівень значущості тесту на відповідність.
  3. Далі ми обчислюємо статистику тесту відповідності, формулу для якої можна знайти в розділі вище.
  4. Ми знаходимо критичне значення критерію відповідності за допомогою таблиці розподілу хі-квадрат.
  5. Порівнюємо тестову статистику з критичним значенням:
    • Якщо тестова статистика менша за критичне значення, альтернативна гіпотеза відхиляється (а нульова гіпотеза приймається).
    • Якщо тестова статистика перевищує критичне значення, нульова гіпотеза відхиляється (а альтернативна гіпотеза приймається).

Приклад тесту на адекватність

  • Власниця магазину каже, що 50% її продажів припадає на продукт A, 35% її продажів припадає на продукт B, а 15% її продажів припадає на продукт C. Проте продані одиниці кожного продукту — це ті, що вказані в наступну таблицю. Проаналізуйте, чи теоретичні дані власника статистично відрізняються від фактично зібраних даних.
Продукт Спостережувані продажі (O i )
Продукт А 453
Продукт Б 268
Продукт C 79
Всього 800

Щоб визначити, чи спостережувані значення еквівалентні очікуваним значенням, ми виконаємо тест на відповідність. Нульова гіпотеза та альтернативна гіпотеза тесту:

\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}

У цьому випадку ми будемо використовувати рівень достовірності 95% для тесту, тому рівень значущості буде 5%.

\alpha=0,05

Щоб знайти значення очікуваних продажів, нам потрібно помножити відсоток очікуваних продажів кожного продукту на загальну кількість здійснених продажів:

\begin{array}{c}E_A=800\cdot 0,50=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

Тому таблиця частоти проблем виглядає наступним чином:

Продукт Спостережувані продажі (O i ) Очікувані продажі (E i )
Продукт А 453 400
Продукт Б 268 280
Продукт C 79 120
Всього 800 800

Тепер, коли ми обчислили всі значення, ми застосовуємо формулу хі-квадрат для обчислення тестової статистики:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

Коли значення тестової статистики обчислено, ми використовуємо таблицю розподілу хі-квадрат, щоб знайти критичне значення тесту. Розподіл хі-квадрат має

k-1=3-1=2

ступенів свободи і рівень значущості

\alpha=0,05

,Ще:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

Таким чином, тестова статистика (21,53) більша за критичне тестове значення (5,991), тому нульову гіпотезу відхиляють, а альтернативну гіпотезу приймають. Це означає, що дані дуже відрізняються, і тому власник магазину очікував інших продажів, ніж насправді.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=”Rendered by QuickLaTeX.com” height=”17″ width=”354″ style=”vertical-align: -4px;”></p></p>
								</div><!-- End Content -->

																	<!-- Start Author Box -->
									<div class=

Про автора

Доктор Бенджамін Андерсон
Редакція

Привіт, я Бенджамін, професор статистики на пенсії, який став викладачем статистики. Маючи великий досвід і знання в галузі статистики, я готовий поділитися своїми знаннями, щоб розширити можливості студентів через Statorials. Дізнайтеся більше

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *