Як визначити рівну чи нерівну дисперсію в t-тестах


Коли ми хочемо порівняти середні значення двох незалежних груп, ми можемо вибрати між двома різними тестами:

Т-критерій Стьюдента: припускає, що обидві групи даних відібрано з сукупностей, які дотримуються нормального розподілу, і що дві сукупності мають однакову дисперсію.

Т-критерій Велча: припускає, що обидві групи даних відібрано з сукупностей, які дотримуються нормального розподілу, але не передбачає, що ці дві сукупності мають однакову дисперсію .

Отже, якщо дві вибірки не мають однакової дисперсії, краще використовувати t-критерій Велча.

Але як ми можемо визначити, чи дві вибірки мають однакову дисперсію?

Є два способи зробити це:

1. Використовуйте емпіричне правило дисперсії.

Як правило, якщо відношення найбільшої дисперсії до найменшої дисперсії менше 4, тоді можна вважати, що дисперсії приблизно рівні, і використовувати t-критерій Стьюдента.

Наприклад, припустимо, що ми маємо такі два приклади:

Зразок 1 має дисперсію 24,86, а зразок 2 має дисперсію 15,76.

Відношення найбільшої дисперсії вибірки до найменшої дисперсії вибірки буде розраховано таким чином:

Співвідношення = 24,86 / 15,76 = 1,577

Оскільки це співвідношення менше 4, можна припустити, що відмінності між двома групами приблизно рівні.

Таким чином, ми могли б застосувати критерій Стьюдента, щоб визначити, чи однакове середнє значення у двох груп.

2. Виконайте F-тест.

F-тест — це формальний статистичний тест, який використовує такі нульові та альтернативні гіпотези:

H 0 : Зразки мають рівні дисперсії.

H A : Зразки не мають однакових дисперсій.

Статистика тесту розраховується наступним чином:

F = s 1 2 / s 2 2

де s 1 2 і s 2 2 – вибіркові дисперсії.

Якщо p-значення, яке відповідає тестовій статистиці, є нижчим за певний рівень значущості (наприклад, 0,05), тоді у нас є достатньо доказів, щоб стверджувати, що вибірки не мають рівних дисперсій.

Знову припустимо, що ми маємо наступні два приклади:

Щоб виконати F-тест на цих двох зразках, ми можемо обчислити статистику F-тесту наступним чином:

  • F = s 1 2 / s 2 2
  • F = 24,86 / 15,76
  • F = 1,577

Згідно з калькулятором F-розподілу , значення F, що дорівнює 1,577, з чисельником df = n 1 -1 = 12 і знаменником df = n 2 -1 = 12 має відповідне значення p 0,22079.

Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. Іншими словами, ми можемо вважати, що дисперсії вибірки рівні.

Таким чином, ми могли б застосувати критерій Стьюдента, щоб визначити, чи однакове середнє значення у двох груп.

Додаткові ресурси

Якщо ви вирішите виконати t-критерій Стьюдента, ви можете використати такі навчальні посібники як довідкові матеріали:

І якщо ви вирішите виконати t-критерій Велча, ви можете використовувати наступні навчальні посібники як посилання:

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *