Як визначити рівну чи нерівну дисперсію в t-тестах
Коли ми хочемо порівняти середні значення двох незалежних груп, ми можемо вибрати між двома різними тестами:
Т-критерій Стьюдента: припускає, що обидві групи даних відібрано з сукупностей, які дотримуються нормального розподілу, і що дві сукупності мають однакову дисперсію.
Т-критерій Велча: припускає, що обидві групи даних відібрано з сукупностей, які дотримуються нормального розподілу, але не передбачає, що ці дві сукупності мають однакову дисперсію .
Отже, якщо дві вибірки не мають однакової дисперсії, краще використовувати t-критерій Велча.
Але як ми можемо визначити, чи дві вибірки мають однакову дисперсію?
Є два способи зробити це:
1. Використовуйте емпіричне правило дисперсії.
Як правило, якщо відношення найбільшої дисперсії до найменшої дисперсії менше 4, тоді можна вважати, що дисперсії приблизно рівні, і використовувати t-критерій Стьюдента.
Наприклад, припустимо, що ми маємо такі два приклади:
Зразок 1 має дисперсію 24,86, а зразок 2 має дисперсію 15,76.
Відношення найбільшої дисперсії вибірки до найменшої дисперсії вибірки буде розраховано таким чином:
Співвідношення = 24,86 / 15,76 = 1,577
Оскільки це співвідношення менше 4, можна припустити, що відмінності між двома групами приблизно рівні.
Таким чином, ми могли б застосувати критерій Стьюдента, щоб визначити, чи однакове середнє значення у двох груп.
2. Виконайте F-тест.
F-тест — це формальний статистичний тест, який використовує такі нульові та альтернативні гіпотези:
H 0 : Зразки мають рівні дисперсії.
H A : Зразки не мають однакових дисперсій.
Статистика тесту розраховується наступним чином:
F = s 1 2 / s 2 2
де s 1 2 і s 2 2 – вибіркові дисперсії.
Якщо p-значення, яке відповідає тестовій статистиці, є нижчим за певний рівень значущості (наприклад, 0,05), тоді у нас є достатньо доказів, щоб стверджувати, що вибірки не мають рівних дисперсій.
Знову припустимо, що ми маємо наступні два приклади:
Щоб виконати F-тест на цих двох зразках, ми можемо обчислити статистику F-тесту наступним чином:
- F = s 1 2 / s 2 2
- F = 24,86 / 15,76
- F = 1,577
Згідно з калькулятором F-розподілу , значення F, що дорівнює 1,577, з чисельником df = n 1 -1 = 12 і знаменником df = n 2 -1 = 12 має відповідне значення p 0,22079.
Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. Іншими словами, ми можемо вважати, що дисперсії вибірки рівні.
Таким чином, ми могли б застосувати критерій Стьюдента, щоб визначити, чи однакове середнє значення у двох груп.
Додаткові ресурси
Якщо ви вирішите виконати t-критерій Стьюдента, ви можете використати такі навчальні посібники як довідкові матеріали:
- Два приклади t-тесту в Excel
- Двовибірковий t-критерій на калькуляторі TI-84
- Двовибірковий t-тест у SPSS
- Два приклади t-тесту в Python
- Калькулятор двовибіркового t-тесту
І якщо ви вирішите виконати t-критерій Велча, ви можете використовувати наступні навчальні посібники як посилання: