T 検定と anova の違いは何ですか?


このチュートリアルでは、 t 検定ANOVAの違い、および各検定をいつ使用するかについて説明します。

T検定

t 検定は、 2 つのグループの平均値の間に統計的に有意な差があるかどうかを判断するために使用されます。 t 検定には次の 2 種類があります。

1. 独立したサンプルの t 検定。これは、2 つのグループの平均の差を比較する場合、およびグループが互いに完全に独立している場合に使用されます。

たとえば、研究者は、食事 A と食事 B のどちらがより体重を減らすのに役立つかを知りたいと考えるかもしれません。無作為に割り当てられた 100 人が食事 A に割り当てられ、さらに無作為に割り当てられた 100 人が食事 B に割り当てられます。3 か月後、研究者は各人の合計体重減少を記録します。 2 つのグループ間の平均体重減少が有意に異なるかどうかを判断するために、研究者は独立したサンプルの t 検定を実行できます。

2. 対応のあるサンプルの t 検定。これは、2 つのグループの平均間の差を比較し、一方のグループの各観測値をもう一方のグループの観測値と関連付けることができる場合に使用されます。

たとえば、クラスの 20 人の生徒がテストを受け、その後、特定のガイドを学習してから、再度テストを受けるとします。 1 回目と 2 回目のテストのスコアの差を比較するには、各生徒の最初のテストのスコアが 2 回目のテストのスコアと関連付けられる可能性があるため、対応のある t テストを使用します。

t 検定で有効な結果が得られるには、次の前提条件を満たす必要があります。

  • ランダム:両方のサンプルのデータを収集するには、ランダム サンプルまたはランダム実験を使用する必要があります。
  • 正規:標本分布は正規またはほぼ正規です。

これらの仮定が満たされている場合は、t 検定を使用して 2 つのグループの平均値の差を検定することができます。

分散分析

ANOVA (分散分析) は、 3 つ以上のグループの平均間に統計的に有意な差があるかどうかを判断するために使用されます。実際に最もよく使用される ANOVA テストは、一元配置分散分析と二元配置分散分析です。

一元配置分散分析:グループを1 つの因子に基づいて分割できる場合、3 つ以上のグループの平均間に統計的に有意な差があるかどうかをテストするために使用されます。

例: 90 人の生徒のクラスを 30 人ずつの 3 つのグループにランダムに分割します。各グループは、試験の準備のために 1 か月間異なる学習テクニックを使用します。月末に、生徒全員が同じ試験を受けます。勉強法が試験の成績に影響するかどうか知りたい。そこで、一元配置分散分析を実行して、3 つのグループの平均スコア間に統計的に有意な差があるかどうかを判断します。

二元配置分散分析:グループが2 つの因子に基づいて分割できる場合、3 つ以上のグループの平均間に統計的に有意な差があるかどうかをテストするために使用されます。

例:運動レベル (運動なし、軽い運動、激しい運動) と性別 (男性、女性) が体重減少に影響するかどうかを判断したいとします。この場合、調査している 2 つの要因は運動と性別であり、応答変数は体重減少 (ポンドで測定) です。二元配置分散分析を実行して、運動と性別が体重減少に影響を与えるかどうか、また運動と性別の間に体重減少に関する相互作用があるかどうかを判断できます。

ANOVA が有効な結果を生成するには、次の前提条件を満たす必要があります。

  • 正規性– 私たちが研究するすべての母集団は正規分布に従います。したがって、たとえば、3 つの異なる学生グループの試験の得点を比較したい場合、最初のグループ、2 番目のグループ、および 3 番目のグループの試験の得点はすべて正規分布する必要があります。
  • 等分散– 各グループの母集団の分散は等しいかほぼ等しい。
  • 独立性– 各グループの観察は互いに独立している必要があります。通常、これはランダム化された設計によって処理されます。

これらの仮定が満たされる場合、ANOVA を使用して 3 つ以上のグループの平均間の差を検定することができます。

各テストの違いを理解する

t 検定と ANOVA の主な違いは、両方の検定で検定統計量を計算して、グループ間に統計的に有意な差があるかどうかを判断する方法です。

独立サンプルの t 検定では、次の検定統計量が使用されます。

検定統計量t = [ ( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

ここで、 x 1x 2はグループ 1 と 2 の標本平均、 dは 2 つの平均間の仮説差 (多くの場合ゼロ)、s 1 2と s 2 2はグループ 1 と 2 の標本分散、そしてn 1と n 2は、それぞれグループ 1 と 2 のサンプル サイズです。

対応のあるサンプルの t 検定では、次の検定統計量が使用されます。

検定統計量t = d / (s d / √n)

ここで、 dは 2 つのグループ間の平均差、 s dは差の標準偏差、 n は各グループのサンプル サイズです (両方のグループが同じサンプル サイズを持つことに注意してください)。

ANOVAでは次の検定統計量が使用されます。

検定統計量F = s 2 b / s 2 w

ここで、 s 2 bはサンプル間の分散、s 2 wはサンプル内の分散です。

t 検定は、2 つのグループ間の平均差と、差の全体の標準偏差の比率を測定します。この比率が十分に高ければ、2 つのグループ間に有意な差があることの十分な証拠となります。

一方、ANOVA は、グループ内の分散と比較したグループ間の分散の比率を測定します。 t 検定と同様、この比率が十分に高ければ、3 つのグループの平均値が同じではないという十分な証拠が得られます。

t 検定と ANOVA のもう 1 つの重要な違いは、t 検定では 2 つのグループの平均値が同じかどうかがわかることです。一方、ANOVA は、3 つのグループがすべて同じ平均値を持つかどうかを示しますが、どのグループが互いに異なる平均値を持つのかを明示的に示しません。

どのグループが互いに異なるかを調べるには、事後テストが必要になります。

各テストをいつ使用するかを理解する

実際には、 2 つのグループの平均を比較する場合 t 検定を使用します。 3 つ以上のグループの平均を比較したい場合は、ANOVA を使用します。

3 つ以上のグループの平均を比較するために単純に複数の t 検定を使用しない根本的な理由は、タイプ I 過誤率の理解に遡ります。 3 つのグループ (グループ A、グループ B、およびグループ C) の平均を比較したいとします。次の 3 つの t 検定を実行したくなるかもしれません。

  • グループ A とグループ B の平均の差を比較する t 検定
  • グループ A とグループ C の平均の差を比較する t 検定
  • グループ B とグループ C の平均の差を比較する t 検定

各 t 検定では、タイプ I の誤りが発生する可能性があります。これは、帰無仮説が実際には真である場合に、帰無仮説を棄却する確率です。この確率は通常 5% です。これは、複数の t 検定を実行すると、この誤り率が増加することを意味します。例えば:

  • 1 回の t 検定でタイプ I 過誤が発生する確率は 1 – 0.95 = 0.05です。
  • 2 つの t 検定でタイプ I の誤りが発生する確率は、1 – (0.95 2 ) = 0.0975です。
  • 2 つの t 検定でタイプ I の誤りが発生する確率は、1 – (0.95 3 ) = 0.1427です。

このエラー率は容認できないほど高いです。幸いなことに、ANOVA はこれらの誤差を制御するため、タイプ I の誤差はわずか 5% にとどまります。これにより、統計的に有意なテスト結果が単に多数のテストを実行して得られた結果ではなく、実際に意味があることをより確信できるようになります。

したがって、3 つ以上のグループの平均値に差があるかどうかを理解したい場合は、結果が統計的に有効で信頼できるものになるように ANOVA を使用する必要があります。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です