Как рассчитать объединенную дисперсию в r
В статистике кластерная дисперсия относится к среднему значению двух или более кластерных дисперсий.
Мы используем слово «объединенный», чтобы указать, что мы «объединяем» две или более групповые дисперсии, чтобы получить одно число для общей дисперсии между группами.
На практике объединенная дисперсия чаще всего используется в двухвыборочном t-тесте , который используется для определения того, равны ли средние значения двух совокупностей.
Объединенная дисперсия между двумя выборками обычно обозначается sp 2 и рассчитывается следующим образом:
s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
К сожалению, не существует встроенной функции для расчета объединенной дисперсии между двумя группами в R, но мы можем вычислить ее довольно легко.
Например, предположим, что мы хотим вычислить объединенную дисперсию между следующими двумя группами:
Следующий код показывает, как вычислить объединенную дисперсию между этими группами в R:
#define groups of data x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20) x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32) #calculate sample size of each group n1 <- length(x1) n2 <- length(x2) #calculate sample variance of each group var1 <- var(x1) var2 <- var(x2) #calculate pooled variance between the two groups pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2) #display pooled variance pooled [1] 46.97143
Суммарная дисперсия между этими двумя группами оказывается равной 46,97143 .
Дополнительные ресурсы
Что такое кластерная дисперсия? (Определение и пример)
Калькулятор комплексного разрыва
Как рассчитать объединенную дисперсию в Excel