什么是聚类方差? (定义&示例)


在统计学中,聚类方差简单地指两个或多个聚类方差的平均值。

我们使用“合并”一词来表示我们正在“合并”两个或多个组方差,以获得组之间共同方差的单个数字。

在实践中,合并方差最常用于双样本 t 检验,用于确定两个总体的均值是否相等。

两个样本之间的合并方差通常表示为sp 2 ,计算公式如下:

sp 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

当两个样本量(n 1和 n 2 )相等时,公式简化如下:

sp 2 = (s 1 2 + s 2 2 ) / 2

何时计算聚类差距

当我们想要比较两个总体平均值时,我们可以使用两个统计检验:

1.双样本 t 检验:该检验假设两个样本之间的方差大致相等。如果我们使用此检验,那么我们将计算合并方差。

2. Welch’s t 检验:该检验不假设两个样本之间的方差近似相等。如果我们使用此检验,我们不会计算合并方差。相反,我们使用不同的公式。

为了确定使用哪个测试,我们使用以下经验法则:

一般规则:如果最大方差与最小方差之比小于 4,则可以假设方差近似相等,并使用双样本 t 检验。

例如,假设样本 1 的方差为 24.5,样本 2 的方差为 15.2。最大样本方差与最小样本方差之比计算如下:

比率: 24.5 / 15.2 = 1.61

该比率小于 4,可以假设两组之间的差异大致相等。因此,我们将使用双样本 t 检验,这意味着我们将计算合并方差。

计算分组偏差的示例

假设我们想知道两种不同种类的海龟的平均体重是否相等。为了测试这一点,我们从每个种群中随机收集海龟样本,并提供以下信息:

样本1:

  • 样本量 n 1 = 40
  • 样本方差 s 1 2 = 18.5

样本2:

  • 样本量 n 2 = 38
  • 样本方差 s 2 2 = 6.7

以下是计算两个样本之间的合并方差的方法:

  • sp 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • s p 2 = ( (40-1)*18.5 + (38-1)*6.7 ) / (40+38-2)
  • s p 2 = (39*18.5 + 37*6.7) / (76) = 12.755

合并方差为12,755

请注意,合并方差值介于两个原始方差 18.5 和 6.7 之间。这是有道理的,因为合并方差只是两个样本方差的加权平均值。

奖励资源:使用此汇总方差计算器自动计算两个样本之间的汇总方差。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注