T 検定で定式化された 4 つの仮説


2 標本 t 検定は、 2 つの母集団の平均が等しいかどうかを検定するために使用されます。

このタイプのテストでは、データに関して次の仮定が行われます。

1. 独立性: 1 つのサンプルの観察は、他のサンプルの観察から独立しています。

2. 正規性:どちらのサンプルもほぼ正規分布を持っています。

3. 分散の均一性: 2 つのサンプルの分散はほぼ同じです。

4. ランダム サンプリング:両方のサンプルはランダム サンプリング方法を使用して取得されました。

これらの仮定の 1 つ以上が違反される場合、2 サンプル t 検定の結果は信頼性が低く、誤解を招く可能性さえあります。

このチュートリアルでは、各前提の説明、前提が満たされているかどうかを判断する方法、および前提に違反している場合の対処方法について説明します。

仮説 1: 独立性

2 標本 t 検定では、1 つの標本からの観測値が他の標本からの観測値から独立していると仮定します。

同じ個人が両方のサンプルに出現する場合、サンプル間の差異について結論を導くことは無効となるため、これは重要な仮定です。

この仮説を検証する方法

この仮定をテストする最も簡単な方法は、各観測値が各サンプルに 1 回だけ出現すること、および各サンプルの観測値がランダム サンプリングによって収集されたことを検証することです。

この前提が尊重されない場合はどうすればよいか

この仮定が満たされない場合、2 サンプルの t 検定の結果は完全に無効になります。このシナリオでは、ランダム サンプリング方法を使用して 2 つの新しいサンプルを収集し、一方のサンプルの各個人がもう一方のサンプルに属さないようにすることが最善です。

仮説 2: 正常性

2 サンプルの t 検定では、2 つのサンプルがほぼ正規分布していると仮定します。

サンプルが正規分布していない場合、サンプル間の差異について結論を導くために検定の p 値を使用することは無効であるため、これは重要な仮定です。

この仮説を検証する方法

サンプル サイズが小さい場合 (n < 50)、Shapiro-Wilk 検定を使用して、各サンプル サイズが正規分布しているかどうかを判断できます。検定の p 値が特定の有意レベルを下回る場合、データはおそらく正規分布していません。

サンプル サイズが大きい場合は、 QQ プロットを使用して、データが正規分布しているかどうかを視覚的に確認することをお勧めします。

データ ポイントが QQ プロットのほぼ直線の対角線に沿って配置されている場合、データ セットはおそらく正規分布に従っています。

この前提が尊重されない場合はどうすればよいか

この仮定に違反する場合は、 マン-ホイットニーの U 検定を実行できます。これは、2 サンプルの t 検定とノンパラメトリックな同等とみなされ、2 つのサンプルが正規分布しているとは想定されません。

仮説 3: 差異の均一性

2 サンプルの t 検定は、2 つのサンプルの分散がほぼ等しいと仮定します。

この仮説を検証する方法

次の経験則を使用して、2 つのサンプル間の分散が等しいかどうかを判断します。最大分散と最小分散の比が 4 未満の場合、分散はほぼ等しいと想定し、両方のサンプル t を使用します。 -テスト。

たとえば、サンプル 1 の分散が 24.5、サンプル 2 の分散が 15.2 であるとします。最大サンプル分散と最小サンプル分散の比率は次のように計算されます。

比率: 24.5 / 15.2 = 1.61

この比率が 4 未満であるため、2 つのグループ間の差異はほぼ等しいと想定できます。

この前提が尊重されない場合はどうすればよいか

この仮定に違反する場合は、ウェルチの t 検定を実行できます。これは 2 サンプル t 検定のノンパラメトリック バージョンであり、2 つのサンプルの分散が等しいとは想定されていません。

仮定 4: ランダムサンプリング

2 サンプルの t 検定では、両方のサンプルがランダム サンプリング方法を使用して取得されたと想定されます。

この仮説を検証する方法

この仮説を検証するために使用できる正式な統計検定はありません。代わりに、対象となる母集団の各個人がどちらかのサンプルに含まれる確率が等しいように、両方のサンプルが ランダム サンプリング方法を使用して取得されていることを確認するだけで済みます。

この前提が尊重されない場合はどうすればよいか

この仮定が満たされない場合、2 つのサンプルが対象の母集団を代表しているとは考えられません。この場合、2 標本 t 検定の結果を 母集団全体に確実に一般化することはできません。

このシナリオでは、ランダム サンプリング方法を使用して 2 つの新しいサンプルを収集するのが最適です。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です