T 検定の最小サンプル サイズ: 説明と例
学生からよくある質問は次のとおりです。
t 検定を実行するために必要な最小サンプル サイズはありますか?
短い答え:
いいえ。t 検定を実行するために必要な最小サンプル サイズはありません。
実際、これまでに使用された最初の t 検定では4 人のサンプルのみが使用されました。
ただし、t 検定の前提が満たされない場合、結果は信頼できない可能性があります。
さらに、サンプルサイズが小さすぎる場合、検定の検出力が低すぎてデータの有意な差異を検出できない可能性があります。
これらの潜在的な問題をそれぞれ詳しく見てみましょう。
t 検定の仮定を理解する
1 サンプル t 検定は、母集団の平均が特定の値に等しいかどうかを検定するために使用されます。
このテストでは次のことを前提としています。
- 独立性: サンプル観測は独立している必要があります。
- ランダムサンプリング: サンプルが関心のある母集団を代表する可能性を最大化するために、ランダムサンプリング方法を使用して観測値を収集する必要があります。
- 正規性: 観測値はほぼ正規分布する必要があります。
2 標本 t 検定は、 2 つの母集団の平均値の間に有意な差があるかどうかを確認するために使用されます。
このテストでは次のことを前提としています。
- 独立性: 各サンプルの観測値は独立している必要があります。
- ランダムサンプリング: 各サンプルからの観測値は、ランダムサンプリング方法を使用して収集される必要があります。
- 正規性: 各サンプルはほぼ正規分布する必要があります。
- 等分散: 各サンプルの分散はほぼ同じである必要があります。
各タイプの t 検定を実行するときに、これらの前提条件の 1 つ以上が満たされない場合、検定結果の信頼性が低くなる可能性があります。
この場合、これらの仮定を行わない代替のノンパラメトリック検定を使用するのが最善です。
1 サンプル t 検定に代わるノンパラメトリックな代替法は、 Wilcoxon 符号付き順位検定です。
2 サンプル t 検定に代わるノンパラメトリックな代替法は、 マンホイットニー U 検定です。
t 検定の威力を理解する
統計的検出力とは、効果が実際に存在する場合にテストでその効果が検出される確率を指します。
使用するサンプル サイズが小さいほど、特定のテストの統計的検出力が低くなることがわかります。これが、研究者が一般に検出力を高め、真の差異を検出する可能性を高めるためにサンプルサイズを大きくすることを望む理由です。
たとえば、2 つの母集団間の真の効果量が 0.5、つまり「中」の効果量であるとします。次の R コードを使用すると、さまざまなサンプル サイズを使用して 2 サンプル t 検定の検出力を計算できます。
#sample size n=10 power. t . test (n=10, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.1838375 #sample size n=30 power. t . test (n=30, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.477841 #sample size n=50 power. t . test (n=50, delta=.5, sd=1, sig.level=.05, type=' two.sample ')$power [1] 0.6968888
結果を解釈する方法は次のとおりです。
- 各サンプルのサイズが n = 10 の場合、検出力は0.184です。
- 各サンプルのサイズが n = 30 の場合、検出力は0.478です。
- 各サンプルのサイズが n = 50 の場合、検出力は0.697です。
サンプルサイズが増加するにつれて検定の検出力が増加することがわかります。
したがって、t 検定を実行するために最小サンプル サイズは必要ありませんが、サンプル サイズが小さいと統計的検出力が低下するため、データの真の違いを検出する能力が低下します。
結論
私たちが学んだことの要約は次のとおりです。
- t 検定を実行するために必要な最小サンプル サイズはありません。
- t 検定の仮定が満たされない場合は、ノンパラメトリックな代替法を使用する必要があります。
- サンプルサイズが小さすぎると、t 検定の検出力が低くなり、データ内の真の違いを検出する検定の能力が低くなります。
追加リソース
次のチュートリアルでは、t 検定に関する追加情報を提供します。
1 サンプル t 検定の概要
2 標本 t 検定の概要
対応のあるサンプルの t 検定の概要
t 検定で定式化された 4 つの仮説