Коли відкидати нульову гіпотезу? (3 приклади)
Перевірка гіпотези — це формальний статистичний тест, який ми використовуємо, щоб відхилити або не відхилити статистичну гіпотезу.
Для перевірки гіпотез ми завжди використовуємо такі кроки:
Крок 1: Сформулюйте нульову та альтернативну гіпотези.
Нульова гіпотеза , позначена H0 , є гіпотезою про те, що вибіркові дані походять лише випадково.
Альтернативна гіпотеза , позначена як HA , є гіпотезою про те, що на вибіркові дані впливає невипадкова причина.
2. Визначте рівень значущості для використання.
Визначтеся з рівнем значущості. Загальні варіанти: .01, .05 і .1.
3. Обчисліть тестову статистику та p-значення.
Використовуйте вибіркові дані, щоб обчислити тестову статистику та відповідне значення p .
4. Відкинути або не відхилити нульову гіпотезу.
Якщо p-значення нижче рівня значущості, ви відхиляєте нульову гіпотезу.
Якщо p-значення не нижче рівня значущості, ви не можете відхилити нульову гіпотезу.
Щоб запам’ятати це правило, можна використати такий чудовий рядок:
«Якщо р слабке, нуль має зникнути».
Іншими словами, якщо p-значення досить низьке, ми повинні відхилити нульову гіпотезу.
Наведені нижче приклади показують, коли відхиляти (чи не відхиляти) нульову гіпотезу для найпоширеніших типів перевірки гіпотез.
Приклад 1: Т-критерій однієї вибірки
Одновибірковий t-критерій використовується, щоб перевірити, чи дорівнює середнє значення сукупності певному значенню.
Наприклад, скажімо, ми хочемо знати, чи становить середня вага певного виду черепах 310 фунтів.
Ми збираємо просту випадкову вибірку з 40 черепах із такою інформацією:
- Обсяг вибірки n = 40
- Середня маса зразка х = 300
- Стандартне відхилення вибірки s = 18,5
Ми можемо використати наступні кроки, щоб виконати одновибірковий t-тест:
Крок 1: Сформулюйте нульову та альтернативну гіпотези
Ми виконаємо t-критерій однієї вибірки з такими гіпотезами:
- H 0 : μ = 310 (середня сукупність дорівнює 310 книгам)
- H A : μ ≠ 310 (середнє значення населення не дорівнює 310 фунтам)
2. Визначте рівень значущості для використання.
Ми виберемо рівень значущості 0,05 .
3. Обчисліть статистику тесту та значення p.
Ми можемо додати числа для розміру вибірки, середнього значення вибірки та стандартного відхилення вибірки в цей одновибірковий калькулятор t-тесту , щоб обчислити тестову статистику та p-значення:
- t-критерій статистики: -3,4187
- Двостороннє p-значення: 0,0015
4. Відкинути або не відхилити нульову гіпотезу.
Оскільки p-значення (0,0015) менше рівня значущості (0,05), ми відхиляємо нульову гіпотезу .
Ми робимо висновок, що є достатньо доказів того, що середня вага черепах у цій популяції не дорівнює 310 фунтам.
Приклад 2: двовибірковий t-критерій
Двовибірковий t-критерій використовується, щоб перевірити, чи рівні середні дві сукупності чи ні.
Наприклад, припустімо, що ми хочемо знати, чи однакова середня вага двох різних видів черепах.
Ми збираємо просту випадкову вибірку з кожної сукупності з такою інформацією:
Зразок 1:
- Обсяг вибірки n 1 = 40
- Середня вага зразка х 1 = 300
- Вибіркове стандартне відхилення s 1 = 18,5
Зразок 2:
- Обсяг вибірки n 2 = 38
- Середня вага зразка х 2 = 305
- Вибіркове стандартне відхилення s 2 = 16,7
Ми можемо використати такі кроки, щоб виконати двовибірковий t-тест:
Крок 1: Сформулюйте нульову та альтернативну гіпотези
Ми виконаємо двовибірковий t-тест із такими припущеннями:
- H 0 : μ 1 = μ 2 (два середні сукупності рівні)
- H 1 : μ 1 ≠ μ 2 (два середні сукупності не рівні)
2. Визначте рівень значущості для використання.
Ми виберемо рівень значущості 0,10 .
3. Обчисліть статистику тесту та значення p.
Ми можемо підключити числа для розмірів вибірки, вибіркових середніх значень і вибіркових стандартних відхилень у цей двовибірковий калькулятор t-тесту, щоб обчислити тестову статистику та p-значення:
- t-критерій статистики: -1,2508
- Двостороннє p-значення: 0,2149
4. Відкинути або не відхилити нульову гіпотезу.
Оскільки p-значення (0,2149) не менше рівня значущості (0,10), ми не можемо відхилити нульову гіпотезу .
У нас немає достатніх доказів того, що середня вага черепах у цих двох популяціях різна.
Приклад 3: t-критерій для парних вибірок
Т-критерій для парних вибірок використовується для порівняння середніх значень двох вибірок, коли кожне спостереження в одній вибірці можна пов’язати зі спостереженням в іншій вибірці.
Наприклад, скажімо, ми хочемо знати, чи здатна певна тренувальна програма збільшити максимальний вертикальний стрибок студентських баскетболістів.
Щоб перевірити це, ми можемо набрати просту випадкову вибірку з 20 студентів-баскетболістів і виміряти кожен з їхніх максимальних вертикальних стрибків. Тоді ми можемо попросити кожного гравця використовувати програму тренувань протягом місяця, а потім знову виміряти їхній максимальний вертикальний стрибок наприкінці місяця:
Ми можемо використати такі кроки, щоб виконати t-тест парних зразків:
Крок 1: Сформулюйте нульову та альтернативну гіпотези
Ми виконаємо t-тест для парних вибірок із такими гіпотезами:
- H 0 : μ до = μ після (дві середні сукупності рівні)
- H 1 : μ до ≠ μ після (два середні сукупності не рівні)
2. Визначте рівень значущості для використання.
Ми виберемо рівень значущості 0,01 .
3. Обчисліть статистику тесту та значення p.
Ми можемо підключити необроблені дані з кожного зразка до цього калькулятора t-критерію парних зразків , щоб обчислити тестову статистику та p-значення:
- t-критерій статистики: -3,226
- Двостороннє p-значення: 0,0045
4. Відкинути або не відхилити нульову гіпотезу.
Оскільки p-значення (0,0045) менше рівня значущості (0,01), ми відхиляємо нульову гіпотезу .
У нас є достатньо доказів, щоб стверджувати, що середній вертикальний стрибок до і після участі в тренувальній програмі неоднаковий.
Бонус: калькулятор правил прийняття рішень
Ви можете використовувати цей калькулятор правил прийняття рішень , щоб автоматично визначити, чи відхиляти нульову гіпотезу для перевірки гіпотези на основі значення тестової статистики.