Контраст гіпотези

У цій статті пояснюється, що таке перевірка гіпотез у статистиці. Отже, ви дізнаєтеся, як проводити перевірку гіпотези, різні типи перевірки гіпотези та можливі помилки, яких можна допустити під час перевірки гіпотези.

Що таке перевірка гіпотези?

Перевірка гіпотези – це процедура, яка використовується для відхилення або відхилення статистичної гіпотези. Під час перевірки гіпотези ми оцінюємо, чи сумісне значення параметра сукупності з тим, що спостерігається у вибірці зазначеної сукупності.

Тобто при перевірці гіпотези аналізується статистична вибірка і на основі отриманих результатів визначається, відхилити або прийняти раніше встановлену гіпотезу.

Майте на увазі, що загалом на основі перевірки гіпотези неможливо зробити висновок із повною впевненістю, що гіпотеза є істинною чи хибною, а те, що гіпотеза просто відхиляється або не базується на отриманих результатах. Таким чином, під час перевірки гіпотези все ще може бути зроблена помилка, навіть якщо є статистичні докази того, що прийняте рішення є найбільш імовірним.

У статистиці перевірку гіпотези також називають перевіркою гіпотези , перевіркою гіпотези або перевіркою значущості .

Теорія перевірки гіпотез була створена англійським статистиком Рональдом Фішером і розвинена Єжи Нейманом і Егоном Пірсоном.

Нульова гіпотеза та альтернативна гіпотеза

Перевірка гіпотези складається з двох типів статистичних гіпотез:

  • Нульова гіпотеза (H 0 ) : це гіпотеза, яка стверджує, що початкова гіпотеза, яку ми маємо щодо параметра сукупності, є хибною. Таким чином, нульова гіпотеза є гіпотезою, яку ми хочемо відхилити.
  • Альтернативна гіпотеза (H 1 ) : дослідницька гіпотеза, істинність якої має бути доведена. Тобто альтернативна гіпотеза є попередньою гіпотезою дослідника, і щоб спробувати довести, що вона правдива, буде виконано контрастну гіпотезу.

На практиці альтернативна гіпотеза формулюється перед нульовою гіпотезою, оскільки саме гіпотеза має бути підтверджена статистичним аналізом вибірки даних. Тоді нульова гіпотеза формулюється просто шляхом протиріччя з альтернативною гіпотезою.

Види перевірки гіпотези

Перевірку гіпотез можна класифікувати за двома різними типами:

  • Перевірка двосторонньої гіпотези (або перевірка двосторонньої гіпотези) : альтернативна гіпотеза перевірки гіпотези стверджує, що параметр сукупності «відрізняється» від конкретного значення.
  • Перевірка однобічної гіпотези (або перевірка однобічної гіпотези) : Альтернативна гіпотеза перевірки гіпотези вказує на те, що параметр генеральної сукупності є «більшим» (правий хвіст) або «меншим» (лівий хвіст) певного значення.

Двостороння перевірка гіпотез

\begin{cases}H_0: \mu=\mu_0\\[2ex]H_1:\mu\neq\mu_0\end{cases}

Однобічна перевірка гіпотези (правий хвіст)

\begin{cases}H_0: \mu\leq \mu_0\\[2ex]H_1:\mu>\mu_0\end{cases}” title=”Rendered by QuickLaTeX.com” height=”65″ width=”102″ style=”vertical-align: 0px;”></p>
</p>
</div>
<div class=

Однобічна перевірка гіпотези (лівий хвіст)

\begin{cases}H_0: \mu\geq\mu_0\\[2ex]H_1:\mu<\mu_0\end{cases}

Область відхилення та область прийняття перевірки гіпотези

Як ми детально побачимо нижче, перевірка гіпотези складається з обчислення характерного значення кожного типу перевірки гіпотези, це значення називається статистикою перевірки гіпотези. Таким чином, після того, як статистику контрасту було обчислено, необхідно спостерігати, в якому з наступних двох регіонів вона розташована, щоб дійти висновку:

  • Область відхилення (або критична область) : це область графіка еталонного розподілу перевірки гіпотези, яка передбачає відхилення нульової гіпотези (і прийняття альтернативної гіпотези).
  • Область прийняття : це область графіка еталонного розподілу перевірки гіпотези, яка передбачає прийняття нульової гіпотези (і відхилення альтернативної гіпотези).

Коротше кажучи, якщо тестова статистика потрапляє в зону відхилення, нульова гіпотеза відхиляється, а альтернативна гіпотеза приймається. Навпаки, якщо тестова статистика потрапляє в область прийнятності, нульова гіпотеза приймається, а альтернативна гіпотеза відхиляється.

Контраст гіпотези

Значення, які встановлюють межі області відхилення та області прийняття, називаються критичними значеннями , так само інтервал значень, який визначає область відхилення, називається довірчим інтервалом . І обидва значення залежать від обраного рівня значущості .

З іншого боку, рішення відхилити або прийняти нульову гіпотезу також можна прийняти шляхом порівняння p-значення (або p-значення), отриманого в результаті перевірки гіпотези, з вибраним рівнем значущості.

Див.: Що таке p-value?

Як зробити перевірку гіпотези

Щоб виконати перевірку гіпотези, слід виконати наступні кроки:

  1. Сформулюйте нульову гіпотезу та альтернативну гіпотезу перевірки гіпотези.
  2. Встановіть бажаний рівень значущості альфа (α).
  3. Обчисліть статистику контрасту гіпотези.
  4. Визначає критичні значення перевірки гіпотези, щоб знати область відхилення та область прийняття перевірки гіпотези.
  5. Спостерігайте, чи є статистика контрасту гіпотези в області відхилення чи області прийняття.
  6. Якщо статистика потрапляє в область відхилення, нульова гіпотеза відхиляється (а альтернативна гіпотеза приймається). Але якщо статистика потрапляє в зону прийнятності, нульова гіпотеза приймається (а альтернативна гіпотеза відхиляється).

Помилки перевірки гіпотез

При перевірці гіпотези, відхиляючи одну гіпотезу та приймаючи іншу тестову гіпотезу, можна допустити одну з двох помилок:

  • Помилка типу I : це помилка, зроблена під час відхилення нульової гіпотези, коли вона насправді вірна.
  • Помилка типу II : це помилка, яка виникає внаслідок прийняття нульової гіпотези, коли вона насправді хибна.
помилка I типу та помилка II типу

З іншого боку, ймовірність здійснення кожного типу помилки називається наступним чином:

  • Альфа-імовірність (α) : це ймовірність скоєння помилки типу I.
  • Бета ймовірність (β) : це ймовірність скоєння помилки типу II.

Подібним чином потужність перевірки гіпотези визначається як ймовірність відхилення нульової гіпотези (H 0 ), якщо вона хибна, або, іншими словами, це ймовірність вибору альтернативної гіпотези (H 1 ), якщо вона істинна. Тому потужність перевірки гіпотези дорівнює 1-β.

Статистика перевірки гіпотез

Статистика перевірки гіпотези — це значення еталонного розподілу перевірки гіпотези, яке використовується для визначення того, відхилено нульову гіпотезу чи ні. Якщо тестова статистика потрапляє в область відхилення, нульова гіпотеза відхиляється (і приймається альтернативна гіпотеза), з іншого боку, якщо тестова статистика потрапляє в область прийняття, нульова гіпотеза приймається (і альтернативна гіпотеза приймається відхилено).альтернативна гіпотеза).

Розрахунок статистики перевірки гіпотези залежить від типу перевірки. Тому нижче наведено формулу для розрахунку статистики для кожного типу перевірки гіпотези.

Перевірка гіпотези для середнього

Формула для статистики перевірки гіпотези для середнього з відомою дисперсією :

\displaystyle Z=\frac{\overline{x}-\mu}{\displaystyle \frac{\sigma}{\sqrt{n}}}

золото:

  • Z

    є статистикою контрасту гіпотези для середнього значення.

  • \overline{x}

    це зразок засобів.

  • \mu

    є запропонованим середнім значенням.

  • \sigma

    стандартне відхилення сукупності.

  • n

    це розмір вибірки.

Коли статистику перевірки гіпотези для середнього розраховано, результат необхідно інтерпретувати, щоб відхилити нульову гіпотезу чи ні:

  • Якщо перевірка гіпотези для середнього є двосторонньою, нульова гіпотеза відхиляється, якщо абсолютне значення статистики перевищує критичне значення Z α/2 .
  • Якщо перевірка гіпотези для середнього збігається з правим хвостом, нульова гіпотеза відхиляється, якщо статистичне значення перевищує критичне значення Z α .
  • Якщо перевірка гіпотези для середнього збігається з лівим хвостом, нульова гіпотеза відхиляється, якщо статистичне значення менше критичного значення -Z α .

\begin{array}{l}H_1: \mu\neq \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } |Z|>Z_{\alpha/2} \text{ se rechaza } H_0\\[3ex]H_1: \mu> \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z>Z_{\alpha} \text{ se rechaza } H_0\\[3ex]H_1: \mu< \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z<-Z_{\alpha} \text{ se rechaza } H_0\end{array}

У цьому випадку критичні значення отримують із стандартизованої таблиці нормального розподілу.

З іншого боку, формула для статистики перевірки гіпотези для середнього з невідомою дисперсією :

\displaystyle t=\frac{\overline{x}-\mu}{\displaystyle \frac{s}{\sqrt{n}}}

золото:

  • t

    це статистика перевірки гіпотези для середнього значення, яке визначається t-розподілом Стьюдента.

  • \overline{x}

    це зразок засобів.

  • \mu

    є запропонованим середнім значенням.

  • s

    є стандартним відхиленням вибірки.

  • n

    це розмір вибірки.

Як і раніше, розрахований результат тестової статистики має бути інтерпретований з критичним значенням, щоб відхилити чи ні нульову гіпотезу:

  • Якщо перевірка гіпотези для середнього є двосторонньою, нульова гіпотеза відхиляється, якщо абсолютне значення статистики перевищує критичне значення t α/2|n-1 .
  • Якщо перевірка гіпотези для середнього збігається з правим хвостом, нульова гіпотеза відхиляється, якщо статистичне значення перевищує критичне значення t α|n-1 .
  • Якщо перевірка гіпотези для середнього збігається з лівим хвостом, нульова гіпотеза відхиляється, якщо статистика менша за критичне значення -t α|n-1 .

\begin{array}{l}H_1: \mu\neq \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } |t|>t_{\alpha/2|n-1} \text{ se rechaza } H_0\\[3ex]H_1: \mu> \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } t>t_{\alpha|n-1} \text{ se rechaza } H_0\\[3ex]H_1: \mu< \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } t<-t_{\alpha|n-1} \text{ se rechaza } H_0\end{array}

Коли дисперсія невідома, критичні тестові значення отримують з таблиці розподілу Стьюдента.

Перевірка гіпотези пропорції

Формула для статистики перевірки гіпотези для пропорції :

\displaystyle Z=\frac{\widehat{p}-p}{\displaystyle\sqrt{\frac{p(1-p)}{n}}}

золото:

  • Z

    це статистика перевірки гіпотези для частки.

  • \widehat{p}

    є пропорцією зразка.

  • p

    це запропоноване значення пропорції.

  • n

    це розмір вибірки.

  • \displaystyle\sqrt{\frac{p(1-p)}{n}}

    є стандартним відхиленням пропорції.

Майте на увазі, що недостатньо обчислити статистику перевірки гіпотези для пропорції, але результат потрібно інтерпретувати:

  • Якщо перевірка гіпотези пропорції є двосторонньою, нульова гіпотеза відхиляється, якщо абсолютне значення статистики перевищує критичне значення Z α/2 .
  • Якщо перевірка гіпотези пропорції збігається з правим хвостом, нульова гіпотеза відхиляється, якщо статистичне значення перевищує критичне значення Z α .
  • Якщо перевірка гіпотези для пропорції збігається з лівим хвостом, нульова гіпотеза відхиляється, якщо статистика менша за критичне значення -Z α .

\begin{array}{l}H_1: p\neq p_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } |Z|>Z_{\alpha/2} \text{ se rechaza } H_0\\[3ex]H_1: p> p_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z>Z_{\alpha} \text{ se rechaza } H_0\\[3ex]H_1: p< p_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z<-Z_{\alpha} \text{ se rechaza } H_0\end{array}

Пам’ятайте, що критичні значення можна легко отримати зі стандартної таблиці нормального розподілу.

Перевірка гіпотези на дисперсію

Формула для розрахунку статистики перевірки гіпотези для дисперсії :

\chi^2=\cfrac{(n-1)s^2}{\sigma^2}

золото:

  • \chi^2

    це статистика перевірки гіпотези для дисперсії, яка має розподіл хі-квадрат.

  • n

    це розмір вибірки.

  • s^2

    дисперсія вибірки.

  • \sigma^2

    є дисперсією запропонованої сукупності.

Щоб інтерпретувати результат статистики, отримане значення необхідно порівняти з критичним значенням тесту.

  • Якщо перевірка гіпотези на дисперсію є двосторонньою, нульова гіпотеза відхиляється, якщо статистичне значення перевищує критичне значення.

    \chi_{1-\alpha/2|n-1}^2

    або якщо критичне значення менше

    \chi_{\alpha/2|n-1}

    .

  • Якщо перевірка гіпотези для дисперсії збігається з правим хвостом, нульова гіпотеза відхиляється, якщо статистика перевищує критичне значення

    \chi_{1-\alpha|n-1}^2

    .

  • Якщо перевірка гіпотези на дисперсію збігається з лівим хвостом, нульова гіпотеза відхиляється, якщо статистика менша за критичне значення

    \chi_{\alpha|n-1}

    .

\begin{array}{l}H_1: \sigma^2\neq \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } \chi^2>\chi^2_{1-\alpha/2|n-1}\text{ se rechaza } H_0\\[3ex]H_1: \sigma^2\neq \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si }\chi^2<\chi^2_{\alpha/2|n-1}\text{ se rechaza } H_0 \\[3ex]H_1: \sigma^2> \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } \chi^2>\chi^2_{1-\alpha|n-1}\text{ se rechaza } H_0\\[3ex]H_1: \sigma^2< \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } \chi^2<\chi^2_{\alpha|n-1}\text{ se rechaza } H_0\end{array}

Критичні значення перевірки гіпотези для дисперсії отримують з таблиці розподілу хі-квадрат. Зверніть увагу, що ступені свободи для розподілу хі-квадрат є розміром вибірки мінус 1.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *