Мінімальний розмір вибірки для t-критерію: пояснення та приклад
Часте питання, яке задають студенти:
Чи існує мінімальний розмір вибірки, необхідний для виконання t-тесту?
Коротка відповідь:
Ні. Немає мінімального розміру вибірки, необхідного для виконання t-критерію.
Фактично, перший t-тест, який коли-небудь використовувався, використовував лише вибірку з чотирьох осіб .
Однак, якщо припущення t-критерію не виконуються, результати можуть бути ненадійними.
Крім того, якщо розмір вибірки замалий, потужність тесту може бути занадто низькою, щоб виявити значні відмінності в даних.
Давайте розглянемо кожну з цих потенційних проблем докладніше.
Розуміння припущень t-тесту
Одновибірковий t-критерій використовується, щоб перевірити, чи дорівнює середнє значення сукупності певному значенню.
Цей тест робить такі припущення:
- Незалежність : вибіркові спостереження мають бути незалежними.
- Випадкова вибірка : спостереження слід збирати методом випадкової вибірки, щоб максимізувати ймовірність того, що вибірка буде репрезентативною для досліджуваної сукупності.
- Нормальність : спостереження повинні бути приблизно нормально розподілені.
Для перевірки наявності суттєвої різниці між середніми значеннями двох генеральних сукупностей використовується двовибірковий t-критерій .
Цей тест робить такі припущення:
- Незалежність : спостереження кожного зразка мають бути незалежними.
- Випадкова вибірка : Спостереження з кожної вибірки повинні бути зібрані за допомогою методу випадкової вибірки.
- Нормальність : кожен зразок має бути розподілений приблизно нормально.
- Рівна дисперсія : кожен зразок повинен мати приблизно однакову дисперсію.
Під час виконання кожного типу t-критерію, якщо одне або декілька з цих припущень не виконуються, результати тесту можуть стати ненадійними.
У цьому випадку найкраще використовувати альтернативний непараметричний тест, який не робить цих припущень.
Непараметричною альтернативою одновибірковому t-критерію є знаковий ранговий критерій Вілкоксона .
Непараметричною альтернативою двовибірковому t-критерію є U-критерій Манна-Уітні .
Розуміння потужності t-тестів
Статистична потужність стосується ймовірності того, що тест виявить ефект, коли він насправді існує.
Можна показати, що чим менший розмір використаної вибірки, тим нижча статистична потужність даного тесту. Ось чому дослідники зазвичай хочуть більших розмірів вибірки, щоб мати вищу потужність і, отже, більшу ймовірність виявлення справжніх відмінностей.
Наприклад, припустимо, що справжній розмір ефекту між двома популяціями становить 0,5 – «середній» розмір ефекту. Ми можемо використати наступний код R, щоб обчислити потужність двовибіркового t-тесту з використанням різних розмірів вибірки:
#sample size n=10 power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.1838375 #sample size n=30 power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.477841 #sample size n=50 power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.6968888
Ось як інтерпретувати результати:
- Коли розмір кожної вибірки становить n = 10, потужність становить 0,184 .
- Коли розмір кожної вибірки становить n = 30, потужність становить 0,478 .
- Коли розмір кожної вибірки становить n = 50, потужність становить 0,697 .
Ми бачимо, що потужність тесту зростає зі збільшенням розміру вибірки.
Таким чином, нам не потрібен мінімальний розмір вибірки для виконання t-критерію, але невеликі розміри вибірки призводять до зниження статистичної потужності, а отже, до зниження здатності виявити справжню різницю в даних.
Висновок
Ось підсумок того, що ми дізналися:
- Для виконання t-тесту не існує мінімального розміру вибірки.
- Якщо припущення t-критерію не виконуються, ми повинні використовувати непараметричну альтернативу.
- Якщо розмір вибірки занадто малий, потужність t-критерію буде низькою, а здатність тесту виявляти справжні відмінності в даних буде низькою.
Додаткові ресурси
Наступні навчальні посібники пропонують додаткову інформацію про t-тести.
Вступ до одновибіркового t-критерію
Вступ до двовибіркового t-тесту
Знайомство з t-критерієм парних зразків
Чотири гіпотези, сформульовані в t-критерії