Як обчислити загальну дисперсію в r
У статистиці кластерна дисперсія відноситься до середнього значення двох або більше кластерних дисперсій.
Ми використовуємо слово «об’єднаний», щоб вказати, що ми «об’єднуємо» дві або більше групових дисперсій для отримання єдиного числа для спільної дисперсії між групами.
На практиці об’єднану дисперсію найчастіше використовують у двовибірковому t-критерії , який використовується для визначення того, чи рівні середні значення двох сукупностей.
Об’єднана дисперсія між двома вибірками зазвичай позначається як sp 2 і обчислюється наступним чином:
s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
На жаль, немає вбудованої функції для обчислення об’єднаної дисперсії між двома групами в R, але ми можемо обчислити її досить легко.
Наприклад, припустімо, що ми хочемо обчислити об’єднану дисперсію між наступними двома групами:
Наступний код показує, як обчислити об’єднану дисперсію між цими групами в R:
#define groups of data x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20) x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32) #calculate sample size of each group n1 <- length(x1) n2 <- length(x2) #calculate sample variance of each group var1 <- var(x1) var2 <- var(x2) #calculate pooled variance between the two groups pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2) #display pooled variance pooled [1] 46.97143
Сумарна дисперсія між цими двома групами виявляється 46,97143 .
Додаткові ресурси
Що таке кластерна дисперсія? (Визначення та приклад)
Комплектний калькулятор розриву
Як обчислити загальну дисперсію в Excel