Как рассчитать объединенную дисперсию в r


В статистике кластерная дисперсия относится к среднему значению двух или более кластерных дисперсий.

Мы используем слово «объединенный», чтобы указать, что мы «объединяем» две или более групповые дисперсии, чтобы получить одно число для общей дисперсии между группами.

На практике объединенная дисперсия чаще всего используется в двухвыборочном t-тесте , который используется для определения того, равны ли средние значения двух совокупностей.

Объединенная дисперсия между двумя выборками обычно обозначается sp 2 и рассчитывается следующим образом:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

К сожалению, не существует встроенной функции для расчета объединенной дисперсии между двумя группами в R, но мы можем вычислить ее довольно легко.

Например, предположим, что мы хотим вычислить объединенную дисперсию между следующими двумя группами:

Следующий код показывает, как вычислить объединенную дисперсию между этими группами в R:

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

Суммарная дисперсия между этими двумя группами оказывается равной 46,97143 .

Дополнительные ресурсы

Что такое кластерная дисперсия? (Определение и пример)
Калькулятор комплексного разрыва
Как рассчитать объединенную дисперсию в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *