如何计算 r 中的聚类标准差
合并标准差只是两个或多个独立组的标准差的加权平均值。
在统计学中,最常见的是双样本t检验,用于检验两个总体的均值是否相等。
计算两组的聚类标准差的公式为:
合并标准差 = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
金子:
- n1 、 n2 :分别为组 1 和组 2 的样本大小。
- s 1 、 s 2 :分别为组 1 和组 2 的标准差。
以下示例显示了计算 R 中两个组之间的聚类标准差的两种方法。
方法一:手动计算聚类标准差
假设我们有两个样本的数据值如下:
- 样品 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
- 样品 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29
以下代码显示如何计算这两个样本之间的汇总标准差:
#define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #find sample standard deviation of each sample s1 <- sd (data1) s2 < -sd (data2) #find sample size of each sample n1 <- length (data1) n2 <- length (data2) #calculate pooled standard deviation pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2)) #view pooled standard deviation pooled [1] 5.789564
合并标准差为5.789564 。
方法 2:使用包计算聚类标准差
计算 R 中两个样本之间的合并标准差的另一种方法是使用Effectize包中的sd_pooled()函数。
下面的代码展示了如何在实际中使用这个函数:
library (effectsize) #define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #calculate pooled standard deviation between two samples sd_pooled(data1, data2) [1] 5.789564
合并标准差为5.789564 。
请注意,这与我们在上一个示例中手动计算的值相匹配。
其他资源
以下教程提供了有关计算聚类标准差的更多信息:
聚类标准差简介
聚类标准差计算器