如何计算 r 中的合并方差
在统计学中,聚类方差是指两个或多个聚类方差的平均值。
我们使用“合并”一词来表示我们正在“合并”两个或多个组方差,以获得组之间共同方差的单个数字。
在实践中,合并方差最常用于双样本 t 检验,用于确定两个总体的均值是否相等。
两个样本之间的合并方差通常表示为sp 2 ,计算公式如下:
sp 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
不幸的是,R 中没有内置函数来计算两组之间的合并方差,但我们可以很容易地计算它。
例如,假设我们要计算以下两组之间的合并方差:
以下代码显示了如何在 R 中计算这些组之间的合并方差:
#define groups of data x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20) x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32) #calculate sample size of each group n1 <- length(x1) n2 <- length(x2) #calculate sample variance of each group var1 <- var(x1) var2 <- var(x2) #calculate pooled variance between the two groups pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2) #display pooled variance pooled [1] 46.97143
这两组之间的汇总方差为46.97143 。