Чотири гіпотези, сформульовані в тесті t
Двовибірковий t-критерій використовується, щоб перевірити, чи рівні середні дві сукупності чи ні.
Цей тип перевірки робить такі припущення щодо даних:
1. Незалежність: спостереження одного зразка не залежать від спостережень іншого зразка.
2. Нормальність: обидва зразки мають приблизно нормальний розподіл.
3. Однорідність дисперсії: дві вибірки мають приблизно однакову дисперсію.
4. Випадкова вибірка: обидва зразки були отримані за допомогою методу випадкової вибірки.
Якщо одне або декілька з цих припущень порушуються, результати двовибіркового t-критерію можуть бути ненадійними або навіть оманливими.
У цьому підручнику ми надаємо пояснення кожного припущення, як визначити, чи виконується припущення, і що робити, якщо воно порушується.
Гіпотеза 1: Незалежність
Двовибірковий t-критерій передбачає, що спостереження з однієї вибірки не залежать від спостережень з іншої вибірки.
Це важливе припущення, тому що якщо ті самі особи з’являються в обох зразках, то не можна робити висновки про відмінності між зразками.
Як перевірити цю гіпотезу
Найпростіший спосіб перевірити це припущення полягає в тому, щоб перевірити, що кожне спостереження з’являється лише один раз у кожній вибірці та що спостереження в кожній вибірці були зібрані шляхом випадкової вибірки.
Що робити, якщо це припущення не виконується
Якщо це припущення не виконується, результати t-критерію двох вибірок є повністю недійсними. У цьому сценарії найкраще зібрати два нових зразки за допомогою методу випадкової вибірки та переконатися, що кожна особина в одному зразку не належить до іншого зразка.
Гіпотеза 2: нормальність
Двовибірковий t-критерій передбачає, що дві вибірки розподілені приблизно нормально.
Це важливе припущення, тому що якщо зразки розподілені неправильно, використовувати p-значення з тесту для висновків про відмінності між зразками не можна.
Як перевірити цю гіпотезу
Якщо розмір вибірки невеликий (n < 50), ми можемо використовувати тест Шапіро-Вілка, щоб визначити, чи кожен розмір вибірки розподілений нормально. Якщо p-значення тесту нижче певного рівня значущості, дані, ймовірно, розподілені неправильно.
Якщо розміри вибірки великі, краще використовувати графік QQ , щоб візуально перевірити, чи нормально розподілені дані.
Якщо точки даних лежать приблизно вздовж прямої діагональної лінії на графіку QQ, то набір даних, ймовірно, відповідає нормальному розподілу.
Що робити, якщо це припущення не виконується
Якщо це припущення порушується, ми можемо виконати U-критерій Манна-Уїтні , який вважається непараметричним еквівалентом двовибіркового t-критерію та не передбачає, що дві вибірки нормально розподілені.
Гіпотеза 3: Однорідність відмінностей
Двовибірковий t-критерій передбачає, що дві вибірки мають приблизно рівні дисперсії.
Як перевірити цю гіпотезу
Ми використовуємо наступне емпіричне правило, щоб визначити, чи дисперсії між двома вибірками рівні: якщо відношення найбільшої дисперсії до найменшої дисперсії менше 4, тоді ми можемо вважати, що дисперсії приблизно рівні, і використовувати обидві вибірки t -тест.
Наприклад, припустимо, що зразок 1 має дисперсію 24,5, а зразок 2 має дисперсію 15,2. Відношення найбільшої дисперсії вибірки до найменшої дисперсії вибірки буде розраховано таким чином:
Співвідношення: 24,5 / 15,2 = 1,61
Оскільки це співвідношення менше 4, можна припустити, що відмінності між двома групами приблизно рівні.
Що робити, якщо це припущення не виконується
Якщо це припущення порушується, ми можемо виконати t-критерій Велча , який є непараметричною версією двовибіркового t-тесту і не передбачає, що дві вибірки мають однакові дисперсії.
Припущення 4: Випадкова вибірка
Двовибірковий t-критерій передбачає, що обидві вибірки були отримані за допомогою методу випадкової вибірки.
Як перевірити цю гіпотезу
Не існує офіційного статистичного тесту, який ми могли б використати для перевірки цієї гіпотези. Замість цього нам просто потрібно переконатися, що обидві вибірки були отримані за допомогою методу випадкової вибірки , щоб кожна особа в популяції, яка нас цікавить, мала однакову ймовірність бути включеною в одну чи іншу вибірку.
Що робити, якщо це припущення не виконується
Якщо це припущення не виконується, то малоймовірно, що наші дві вибірки є репрезентативними для досліджуваної сукупності. У цьому випадку ми не можемо надійно узагальнити результати двовибіркового t-тесту на загальну популяцію .
У цьому сценарії найкраще зібрати дві нові проби за допомогою методу випадкової вибірки.