如何计算 r 中的聚类标准差


合并标准差只是两个或多个独立组的标准差的加权平均值。

在统计学中,最常见的是双样本t检验,用于检验两个总体的均值是否相等。

计算两组的聚类标准差的公式为:

合并标准差 = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

金子:

  • n1n2分别为组 1 和组 2 的样本大小。
  • s 1 、 s 2分别为组 1 和组 2 的标准差。

以下示例显示了计算 R 中两个组之间的聚类标准差的两种方法。

方法一:手动计算聚类标准差

假设我们有两个样本的数据值如下:

  • 样品 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
  • 样品 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

以下代码显示如何计算这两个样本之间的汇总标准差:

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

合并标准差为5.789564

方法 2:使用包计算聚类标准差

计算 R 中两个样本之间的合并标准差的另一种方法是使用Effectize包中的sd_pooled()函数。

下面的代码展示了如何在实际中使用这个函数:

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

合并标准差为5.789564

请注意,这与我们在上一个示例中手动计算的值相匹配。

其他资源

以下教程提供了有关计算聚类标准差的更多信息:

聚类标准差简介
聚类标准差计算器

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注