T 検定で等分散または不等分散を決定する方法
2 つの独立したグループの平均を比較したい場合は、2 つの異なる検定から選択できます。
スチューデントの t 検定:両方のデータ グループが正規分布に従う母集団からサンプリングされており、2 つの母集団の分散が同じであると仮定します。
ウェルチの t 検定:両方のデータ グループが正規分布に従う母集団からサンプリングされていることを前提としていますが、これら 2 つの母集団が同じ分散を持つことは想定していません。
したがって、2 つのサンプルの分散が同じでない場合は、Welch の t 検定を使用する方が適切です。
しかし、2 つのサンプルの分散が同じかどうかはどうやって判断できるのでしょうか?
これを行うには 2 つの方法があります。
1. 分散の経験則を使用します。
一般的な規則として、最大分散と最小分散の比が 4 未満の場合、分散はほぼ等しいと仮定して、スチューデントの t 検定を使用できます。
たとえば、次の 2 つの例があるとします。
サンプル 1 の分散は 24.86、サンプル 2 の分散は 15.76 です。
最大サンプル分散と最小サンプル分散の比率は次のように計算されます。
比率 = 24.86 / 15.76 = 1.577
この比率が 4 未満であるため、2 つのグループ間の差異はほぼ等しいと想定できます。
したがって、Student の t 検定を実行して、2 つのグループの平均が同じかどうかを判断できます。
2. F 検定を実行します。
F 検定は、次の帰無仮説と対立仮説を使用する正式な統計検定です。
H 0 : サンプルの分散は等しい。
H A : サンプルの分散は等しくありません。
検定統計量は次のように計算されます。
F = s 1 2 / s 2 2
ここで、s 1 2と s 2 2は標本分散です。
検定統計量に対応する p 値が特定の有意水準 (0.05 など) を下回っている場合、サンプルの分散が等しいと言える十分な証拠があります。
もう一度、次の 2 つの例があると仮定してみましょう。
これら 2 つのサンプルに対して F 検定を実行するには、次のように F 検定統計量を計算します。
- F = s 1 2 / s 2 2
- F = 24.86 / 15.76
- F = 1.577
F Distribution Calculatorによると、分子 df = n 1 -1 = 12、分母 df = n 2 -1 = 12 の F 値 1.577 には、対応する p 値 0.22079 があります。
この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。言い換えれば、サンプルの分散は等しいと仮定できます。
したがって、Student の t 検定を実行して、2 つのグループの平均が同じかどうかを判断できます。
追加リソース
Student の t 検定を実行する場合は、次のチュートリアルを参考として使用できます。
- Excel での 2 つの t 検定の例
- TI-84 計算機での 2 サンプルの t 検定
- SPSS の 2 サンプル t 検定
- Python での 2 つの t 検定の例
- 2 サンプル t 検定計算機
ウェルチの t 検定を実行することにした場合は、次のチュートリアルを参考として使用できます。