ウェルチの t 検定: いつ使用するか + 例
2 つの独立したグループの平均を比較したい場合、2 つの異なる検定のどちらを使用するかを選択できます。
スチューデントの t 検定:この検定では、2 つのグループのデータが正規分布に従う母集団からサンプリングされており、2 つの母集団が同じ分散を持つことを前提としています。
ウェルチの t 検定:この検定では、両方のデータ グループが正規分布に従う母集団からサンプリングされていることを前提としていますが、これら 2 つの母集団が同じ分散を持つとは想定していません。
スチューデントの t 検定とウェルチの t 検定の違い
Student の t 検定と Welch の t 検定の実行方法には 2 つの違いがあります。
- テスト統計
- 自由度
学生の t 検定:
検定統計量: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
ここで、 x 1とx 2はサンプル平均、n 1と n 2はそれぞれサンプル 1 とサンプル 2 のサンプル サイズです。s p は次のように計算されます。
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
ここで、s 1 2と s 2 2は標本分散です。
自由度: n 1 + n 2 – 2
ウェルチの T 検定
検定統計量: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
自由度: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
ウェルチの t 検定の自由度を計算する式では、2 つの標準偏差の差が考慮されます。 2 つの サンプルの標準偏差が同じである場合、ウェルチの t 検定の自由度はスチューデントの t 検定の自由度とまったく同じになります。
通常、2 つのサンプルの標準偏差は同じではないため、ウェルチの t 検定の自由度はスチューデントの t 検定の自由度よりも小さくなる傾向があります。
ウェルチの t 検定の自由度は一般に整数ではないことに注意することも重要です。手動でテストする場合は、最小の整数に四捨五入することをお勧めします。 Rのような統計ソフトウェアを使用すると、ソフトウェアは自由度の小数値を提供できます。
ウェルチ t 検定はいつ使用する必要がありますか?
ウェルチの t 検定は、サンプル サイズと分散がグループ間で等しくない場合にスチューデントの t 検定よりも優れたパフォーマンスを示し、サンプル サイズが異なる場合でも同じ結果が得られるため、2 つの独立したグループの平均を比較する場合はウェルチの t 検定をデフォルトの選択肢にするべきだと主張する人もいます。異なっています。違いは等しいです。
実際には、2 つのグループの平均を比較する場合、各グループの標準偏差が同じになる可能性はほとんどありません。したがって、分散の等価性について仮定を立てる必要がないように、常にウェルチの t 検定を使用することをお勧めします。
ウェルチの t 検定の使用例
次に、次の 2 つのサンプルに対してウェルチの t 検定を実行して、それらの母平均が有意水準 0.05 で有意に異なるかどうかを判断します。
サンプル1: 14、15、15、15、16、18、22、23、24、25、25
サンプル2: 10、12、14、15、18、22、24、27、31、33、34、34、34
3 つの異なる方法でテストを実行する方法を説明します。
- 手によって
- Microsoft Excelを使用する
- R統計プログラミング言語を使用する
手動によるウェルチの T 検定
ウェルチ t 検定を手動で実行するには、まずサンプル平均、サンプル分散、およびサンプル サイズを見つける必要があります。
x1 – 19.27
x2 – 23.69
s 1 2 – 午後 8 時 42 分
アート2 2 – 83.23
# 1 ~11
# 2 ~13
次に、これらの数値を入力して検定統計量を見つけることができます。
検定統計量: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
テスト統計: (19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538
自由度: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
自由度: (20.42/11 + 83.23/13) 2 / { [ (20.42/11) 2 / (11 – 1) ] + [ (83.23/13) 2 / (13 – 1) ] } = 18.137。この結果を最も近い整数18に丸めます。
最後に、18 自由度の alpha = 0.05 の両側検定に対応する t 分布表の臨界値tを見つけます。
臨界値 t は2.101です。検定統計量の絶対値 (1.538) は臨界値 t より大きくないため、検定の帰無仮説を棄却できません。 2 つの母集団の平均値が大きく異なると言える十分な証拠はありません。
Excel を使用したウェルチの T 検定
Excel でウェルチの t 検定を実行するには、まず無料の Analysis ToolPak ソフトウェアをダウンロードする必要があります。まだ Excel にダウンロードしていない場合は、 ダウンロード方法に関する簡単なチュートリアルを書きました。
Analysis ToolPak をダウンロードしたら、以下の手順に従って 2 つのサンプルに対してウェルチの t 検定を実行できます。
1. データを入力します。 2 つのサンプルのデータ値を列 A と B に入力し、各列の最初のセルに見出し「サンプル 1」と「サンプル 2」を入力します。
2. 分析ツールを使用してウェルチの t 検定を実行します。上部のリボンに沿って[データ]タブに移動します。次に、 [分析]グループで、[分析ツール] アイコンをクリックします。
表示されるダイアログ ボックスで、 [t 検定: 不等分散を仮定した 2 つのサンプル] をクリックし、[OK] をクリックします。
最後に、以下の値を入力して、「OK」をクリックします。
次の結果が表示されるはずです。
このテストの結果は、手動で取得した結果に対応していることに注意してください。
- 検定統計量は-1.5379です。
- 両側臨界値は2.1009です。
- 検定統計量の絶対値は両側臨界値より大きくないため、2 つの母集団の平均値は統計的に異なりません。
- さらに、検定の両側 p 値は 0.14 で、0.05 よりも大きく、2 つの母集団の平均値に統計的な差異がないことが確認されます。
R を使用したウェルチの t 検定
次のコードは、 R統計プログラミング言語を使用して 2 つのサンプルに対してウェルチの t 検定を実行する方法を示しています。
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
t.test()関数は、次の関連する出力を表示します。
- t:検定統計量 = -1.5379
- df : 自由度 = 18.137
- p 値:両側検定の p 値 = 0.1413
- 95% 信頼区間: 母集団平均の真の差の 95%信頼区間= (-10.45, 1.61)
この検定の結果は、手動および Excel を使用して取得した結果に対応します。これら 2 つの母集団の平均の差は、アルファ = 0.05 のレベルでは統計的に有意ではありません。