Минимальный размер выборки для t-теста: объяснение и пример
Частый вопрос, который задают студенты:
Существует ли минимальный размер выборки, необходимый для проведения t-теста?
Короткий ответ:
Нет. Для проведения t-теста не существует минимального размера выборки.
Фактически, первый когда-либо использовавшийся t-тест использовал выборку только из четырех человек .
Однако если предположения t-критерия не выполняются, результаты могут быть ненадежными.
Кроме того, если размер выборки слишком мал, мощность теста может оказаться слишком низкой для выявления существенных различий в данных.
Давайте рассмотрим каждую из этих потенциальных проблем более подробно.
Понимание предположений t-теста
Одновыборочный t-критерий используется для проверки того, соответствует ли среднее значение совокупности определенному значению.
Этот тест предполагает следующие предположения:
- Независимость : Выборочные наблюдения должны быть независимыми.
- Случайная выборка . Наблюдения следует собирать с использованием метода случайной выборки, чтобы максимизировать вероятность того, что выборка будет репрезентативной для интересующей совокупности.
- Нормальность : наблюдения должны быть примерно нормально распределены.
Двухвыборочный t-критерий используется для проверки наличия значительной разницы между средними значениями двух совокупностей.
Этот тест предполагает следующие предположения:
- Независимость : наблюдения каждого образца должны быть независимыми.
- Случайная выборка : Наблюдения из каждой выборки следует собирать с использованием метода случайной выборки.
- Нормальность : каждая выборка должна быть распределена примерно нормально.
- Равная дисперсия : каждая выборка должна иметь примерно одинаковую дисперсию.
Если при выполнении каждого типа t-теста одно или несколько из этих допущений не выполняются, результаты теста могут стать ненадежными.
В этом случае лучше всего использовать альтернативный непараметрический тест, который не делает таких допущений.
Непараметрической альтернативой одновыборочному t-критерию является знаковый ранговый критерий Уилкоксона .
Непараметрической альтернативой двухвыборочному t-критерию является U-критерий Манна-Уитни .
Понимание силы t-тестов
Статистическая мощность означает вероятность того, что тест обнаружит эффект, когда он действительно существует.
Можно показать, что чем меньше размер используемой выборки, тем ниже статистическая мощность данного теста. Вот почему исследователи обычно хотят большего размера выборки, чтобы иметь более высокую мощность и, следовательно, большую вероятность обнаружения истинных различий.
Например, предположим, что истинный размер эффекта между двумя популяциями составляет 0,5 – «средний» размер эффекта. Мы можем использовать следующий код R для расчета мощности двухвыборочного t-теста с использованием разных размеров выборки:
#sample size n=10 power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.1838375 #sample size n=30 power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.477841 #sample size n=50 power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.6968888
Вот как интерпретировать результаты:
- Когда размер каждой выборки n = 10, мощность равна 0,184 .
- Когда размер каждой выборки n = 30, мощность равна 0,478 .
- Когда размер каждой выборки n = 50, мощность равна 0,697 .
Мы видим, что мощность теста увеличивается с увеличением размера выборки.
Таким образом, нам не нужен минимальный размер выборки для проведения t-критерия, но небольшие размеры выборки приводят к снижению статистической мощности и, следовательно, к снижению способности обнаруживать истинную разницу в данных.
Заключение
Вот краткое изложение того, что мы узнали:
- Для проведения t-теста не существует минимального размера выборки.
- Если предположения t-критерия не выполняются, мы должны использовать непараметрическую альтернативу.
- Если размер выборки слишком мал, мощность t-теста будет низкой, а способность теста обнаруживать истинные различия в данных будет низкой.
Дополнительные ресурсы
Следующие руководства содержат дополнительную информацию о t-тестах.
Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Введение в t-критерий парных выборок
Четыре гипотезы, сформулированные в t-тесте