サタースウェイト近似: 定義と例
サタースウェイト近似は、2 サンプルの t 検定で「有効自由度」を求めるために使用される式です。
これは、 サンプルの抽出元の母集団の分散が等しいと仮定せずに、2 つの独立したサンプルの平均を比較するウェルチの t 検定で最もよく使用されます。
サタースウェイト近似の式は次のとおりです。
Degrees of freedom: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]}
金:
- s 1 2 、s 2 2 :それぞれ最初と 2 番目のサンプルのサンプル分散。
- n1 、 n2 :それぞれ最初と 2 番目のサンプルのサンプル サイズ。
次の例は、サタースウェイト近似を使用して有効自由度を計算する方法を示しています。
例: サタースウェイト近似の計算
2 つの異なる植物種の平均高さが等しいかどうかを知りたいとします。そこで、各種の単純なランダム サンプルを 2 つ収集し、各サンプルの植物の高さを測定します。
次の値は、各サンプルの高さ (インチ) を示します。
サンプル1: 14、15、15、15、16、18、22、23、24、25、25
サンプル2: 10、12、14、15、18、22、24、27、31、33、34、34、34
平均、分散、サンプルサイズは次のようになります。
- x1 = 19.27
- x2 = 23.69
- s 1 2 = 20.42
- s 2 2 = 83.23
- n1 = 11
- n2 = 13
次に、分散とサンプル サイズの値をサタースウェイト近似式に代入して、有効な自由度を求めることができます。
df = (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 / (n 2 – 1)]}
df = (20.42/11 + 83.23/13) 2 /{[(20.42/11) 2 /(11 – 1)] + [(83.23/13) 2 /(13 – 1)]} = 18.137
有効自由度は18,137であることがわかります。
通常、この値は最も近い整数に四捨五入されるため、ウェルチの t 検定で使用する自由度は18になります。
最後に、18 自由度の alpha = 0.05 の両側検定に対応する t 分布表の臨界値tを見つけます。
臨界値 t は2.101です。
次に、検定統計量を次のように計算します。
検定統計量: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
テスト統計: (19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538
検定統計量の絶対値 (1.538) は臨界値 t より大きくないため、検定の帰無仮説を棄却できません。
2 つの母集団の平均値が大きく異なると言える十分な証拠はありません。
実際のサタースウェイト近似
実際には、サタースウェイト近似を手動で計算する必要があることはほとんどありません。
代わりに、R、Python、Excel、SAS、Stata などの一般的な統計ソフトウェアはすべて、サタースウェイト近似を使用して有効自由度を自動的に計算できます。