什么是聚类方差? (定义&;示例)
在统计学中,聚类方差简单地指两个或多个聚类方差的平均值。
我们使用“合并”一词来表示我们正在“合并”两个或多个组方差,以获得组之间共同方差的单个数字。
在实践中,合并方差最常用于双样本 t 检验,用于确定两个总体的均值是否相等。
两个样本之间的合并方差通常表示为sp 2 ,计算公式如下:
sp 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
当两个样本量(n 1和 n 2 )相等时,公式简化如下:
sp 2 = (s 1 2 + s 2 2 ) / 2
何时计算聚类差距
当我们想要比较两个总体平均值时,我们可以使用两个统计检验:
1.双样本 t 检验:该检验假设两个样本之间的方差大致相等。如果我们使用此检验,那么我们将计算合并方差。
2. Welch’s t 检验:该检验不假设两个样本之间的方差近似相等。如果我们使用此检验,我们不会计算合并方差。相反,我们使用不同的公式。
为了确定使用哪个测试,我们使用以下经验法则:
一般规则:如果最大方差与最小方差之比小于 4,则可以假设方差近似相等,并使用双样本 t 检验。
例如,假设样本 1 的方差为 24.5,样本 2 的方差为 15.2。最大样本方差与最小样本方差之比计算如下:
比率: 24.5 / 15.2 = 1.61
该比率小于 4,可以假设两组之间的差异大致相等。因此,我们将使用双样本 t 检验,这意味着我们将计算合并方差。
计算分组偏差的示例
假设我们想知道两种不同种类的海龟的平均体重是否相等。为了测试这一点,我们从每个种群中随机收集海龟样本,并提供以下信息:
样本1:
- 样本量 n 1 = 40
- 样本方差 s 1 2 = 18.5
样本2:
- 样本量 n 2 = 38
- 样本方差 s 2 2 = 6.7
以下是计算两个样本之间的合并方差的方法:
- sp 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- s p 2 = ( (40-1)*18.5 + (38-1)*6.7 ) / (40+38-2)
- s p 2 = (39*18.5 + 37*6.7) / (76) = 12.755
合并方差为12,755 。
请注意,合并方差值介于两个原始方差 18.5 和 6.7 之间。这是有道理的,因为合并方差只是两个样本方差的加权平均值。
奖励资源:使用此汇总方差计算器自动计算两个样本之间的汇总方差。