Как определить равную или неравную дисперсию в t-тестах
Когда мы хотим сравнить средние значения двух независимых групп, мы можем выбрать один из двух разных тестов:
T-критерий Стьюдента: предполагает, что обе группы данных выбраны из популяций, которые следуют нормальному распределению, и что две популяции имеют одинаковую дисперсию.
T-критерий Уэлча: предполагает, что обе группы данных выбраны из популяций, которые следуют нормальному распределению, но не предполагает, что эти две популяции имеют одинаковую дисперсию .
Итак, если две выборки не имеют одинаковой дисперсии, лучше использовать t-критерий Уэлча.
Но как мы можем определить, имеют ли две выборки одинаковую дисперсию?
Есть два способа сделать это:
1. Используйте эмпирическое правило дисперсии.
Как правило, если отношение наибольшей дисперсии к наименьшей дисперсии меньше 4, то можно предположить, что дисперсии примерно равны, и использовать t-критерий Стьюдента.
Например, предположим, что у нас есть следующие два примера:
Образец 1 имеет дисперсию 24,86, а образец 2 — 15,76.
Отношение наибольшей выборочной дисперсии к наименьшей выборочной дисперсии будет рассчитываться следующим образом:
Соотношение = 24,86/15,76 = 1,577
Поскольку это соотношение меньше 4, можно предположить, что различия между двумя группами примерно равны.
Таким образом, мы могли бы провести t-критерий Стьюдента, чтобы определить, имеют ли две группы одинаковое среднее значение.
2. Выполните F-тест.
F-тест — это формальный статистический тест, в котором используются следующие нулевые и альтернативные гипотезы:
H 0 : Выборки имеют равные дисперсии.
H A : Выборки не имеют равных дисперсий.
Статистика теста рассчитывается следующим образом:
F = с 1 2 / с 2 2
где s 1 2 и s 2 2 — выборочные дисперсии.
Если значение p, соответствующее тестовой статистике, ниже определенного уровня значимости (например, 0,05), то у нас есть достаточно доказательств, чтобы сказать, что выборки не имеют равных дисперсий.
Давайте снова предположим, что у нас есть следующие два примера:
Чтобы выполнить F-тест для этих двух образцов, мы можем рассчитать статистику F-теста следующим образом:
- F = с 1 2 / с 2 2
- Ф = 24,86/15,76
- Ф = 1,577
Согласно калькулятору распределения F , значение F 1,577 с числителем df = n 1 -1 = 12 и знаменателем df = n 2 -1 = 12 имеет соответствующее значение p 0,22079.
Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Другими словами, мы можем предположить, что выборочные дисперсии равны.
Таким образом, мы могли бы провести t-критерий Стьюдента, чтобы определить, имеют ли две группы одинаковое среднее значение.
Дополнительные ресурсы
Если вы решите выполнить t-критерий Стьюдента, вы можете использовать следующие учебные пособия в качестве справочных материалов:
- Два примера t-теста в Excel
- Двухвыборочный t-критерий на калькуляторе TI-84
- Двухвыборочный t-критерий в SPSS
- Два примера t-теста на Python
- Калькулятор t-теста для двух выборок
И если вы решите выполнить t-тест Уэлча, вы можете использовать следующие руководства в качестве справочных материалов: