萨特思韦特近似:定义和示例
Satterthwaite 近似是用于在两个样本 t 检验中查找“有效自由度”的公式。
它最常用于韦尔奇 t 检验,该检验比较两个独立样本的均值,而不假设从中抽取样本的总体具有相等的方差。
Satterthwaite 近似的公式如下:
Degrees of freedom: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]}
金子:
- s 1 2 , s 2 2 :分别是第一个和第二个样本的样本方差。
- n1 , n2 :分别是第一个和第二个样本的样本大小。
以下示例演示如何使用 Satterthwaite 近似来计算有效自由度。
示例:Satterthwaite 近似的计算
假设我们想知道两种不同植物物种的平均高度是否相等。因此,我们将收集每个物种的两个简单随机样本,并测量每个样本中植物的高度。
以下值表示每个样本的高度(以英寸为单位):
样品 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
样品 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
均值、方差和样本量如下:
- x1 = 19.27
- x2 = 23.69
- s 1 2 = 20.42
- s 2 2 = 83.23
- n1 = 11
- n2 = 13
然后我们可以将方差和样本大小的值代入 Satterthwaite 近似公式中来找到有效自由度:
df = (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 / (n 2 – 1)]}
df = (20.42/11 + 83.23/13) 2 /{[(20.42/11) 2 /(11 – 1)] + [(83.23/13) 2 /(13 – 1)]} = 18.137
有效自由度为18,137 。
通常,我们将此值舍入为最接近的整数,因此我们在 Welch t 检验中使用的自由度为18 。
最后,我们将在 t 分布表中找到临界值t ,它对应于 18 个自由度的 alpha = 0.05 的双尾检验:
临界值 t 是2.101 。
然后我们将计算我们的检验统计量如下:
检验统计量:( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
检验统计量:(19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538
由于我们的检验统计量的绝对值 (1.538) 不大于临界值 t,因此我们无法拒绝检验的原假设。
没有足够的证据表明两个人群的均值存在显着差异。
实践中的萨特思韦特近似
在实践中,您很少需要手动计算 Satterthwaite 近似值。
相反,R、Python、Excel、SAS 和 Stata 等常见统计软件都可以使用 Satterthwaite 近似来自动为您计算有效自由度。