Як обчислити загальну дисперсію в r


У статистиці кластерна дисперсія відноситься до середнього значення двох або більше кластерних дисперсій.

Ми використовуємо слово «об’єднаний», щоб вказати, що ми «об’єднуємо» дві або більше групових дисперсій для отримання єдиного числа для спільної дисперсії між групами.

На практиці об’єднану дисперсію найчастіше використовують у двовибірковому t-критерії , який використовується для визначення того, чи рівні середні значення двох сукупностей.

Об’єднана дисперсія між двома вибірками зазвичай позначається як sp 2 і обчислюється наступним чином:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

На жаль, немає вбудованої функції для обчислення об’єднаної дисперсії між двома групами в R, але ми можемо обчислити її досить легко.

Наприклад, припустімо, що ми хочемо обчислити об’єднану дисперсію між наступними двома групами:

Наступний код показує, як обчислити об’єднану дисперсію між цими групами в R:

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

Сумарна дисперсія між цими двома групами виявляється 46,97143 .

Додаткові ресурси

Що таке кластерна дисперсія? (Визначення та приклад)
Комплектний калькулятор розриву
Як обчислити загальну дисперсію в Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *