Что такое кластерная дисперсия? (определение & #038; пример)
В статистике кластерная дисперсия просто относится к среднему значению двух или более кластерных дисперсий.
Мы используем слово «объединенный», чтобы указать, что мы «объединяем» две или более групповые дисперсии, чтобы получить одно число для общей дисперсии между группами.
На практике объединенная дисперсия чаще всего используется в двухвыборочном t-тесте , который используется для определения того, равны ли средние значения двух совокупностей.
Объединенная дисперсия между двумя выборками обычно обозначается sp 2 и рассчитывается следующим образом:
s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
Когда два размера выборки (n 1 и n 2 ) равны, формула упрощается следующим образом:
s п 2 знак равно (s 1 2 + s 2 2 ) / 2
Когда рассчитывать кластерный разрыв
Когда мы хотим сравнить два средних значения генеральной совокупности, мы потенциально можем использовать два статистических теста:
1. Двухвыборочный t-критерий . Этот тест предполагает, что дисперсии между двумя выборками примерно равны. Если мы используем этот тест, мы вычисляем объединенную дисперсию.
2. t-критерий Уэлча : этот тест не предполагает , что дисперсии между двумя выборками примерно равны. Если мы используем этот тест, мы не рассчитываем объединенную дисперсию. Вместо этого мы используем другую формулу.
Чтобы определить, какой тест использовать, мы используем следующее практическое правило:
Общее правило: если отношение наибольшей дисперсии к наименьшей дисперсии меньше 4, то можно предположить, что дисперсии примерно равны, и использовать двухвыборочный t-критерий.
Например, предположим, что дисперсия образца 1 составляет 24,5, а дисперсия образца 2 — 15,2. Отношение наибольшей выборочной дисперсии к наименьшей выборочной дисперсии будет рассчитываться следующим образом:
Соотношение: 24,5/15,2 = 1,61
Поскольку это соотношение меньше 4, можно предположить, что различия между двумя группами примерно равны. Итак, мы будем использовать двухвыборочный t-критерий, что означает, что мы рассчитаем объединенную дисперсию.
Пример расчета группового отклонения
Предположим, мы хотим узнать, равен ли средний вес двух разных видов черепах. Чтобы проверить это, мы собираем случайную выборку черепах из каждой популяции со следующей информацией:
Образец 1:
- Размер выборки n 1 = 40
- Выборочная дисперсия s 1 2 = 18,5
Образец 2:
- Размер выборки n 2 = 38
- Выборочная дисперсия s 2 2 = 6,7
Вот как можно рассчитать объединенную дисперсию между двумя выборками:
- s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- с п 2 = ( (40-1)*18,5 + (38-1)*6,7 )/(40+38-2)
- с п 2 = (39*18,5 + 37*6,7)/(76) = 12,755
Объединенная дисперсия составляет 12 755 .
Обратите внимание, что значение объединенной дисперсии находится между двумя исходными дисперсиями: 18,5 и 6,7. Это имеет смысл, учитывая, что объединенная дисперсия представляет собой просто средневзвешенное значение двух выборочных дисперсий.
Бонусный ресурс: используйте этот калькулятор объединенной дисперсии для автоматического расчета объединенной дисперсии между двумя выборками.