ネストされたモデルとは何ですか? (定義&例)
ネストされたモデルは、別の回帰モデル内の予測子変数のサブセットを含む回帰モデルにすぎません。
たとえば、4 つの予測変数に基づいてバスケットボール選手の得点数を予測する次の回帰モデル (モデル A と呼びます) があるとします。
ポイント = β 0 + β 1 (分) + β 2 (高さ) + β 3 (位置) + β 4 (ショット) + ε
入れ子になったモデル (モデル B と呼びます) の例は、モデル A の予測子変数を 2 つだけ含む次のモデルになります。
ポイント = β 0 + β 1 (分) + β 2 (高さ) + ε
モデル B にはモデル A の予測変数のサブセットが含まれているため、モデル B はモデル A 内にネストされていると言えます。
ただし、3 つの予測子変数を含む別のモデル (モデル C と呼びます) がある場合を考えてみましょう。
ポイント = β 0 + β 1 (分) + β 2 (身長) + β 3 (フリースロー試投数)
各モデルには他のモデルに含まれていない予測子変数が含まれているため、モデル C がモデル A 内にネストされているとは言えません。
ネストされたモデルの重要性
実際、予測子変数の完全なセットを含むモデルが、それらの予測子変数のサブセットを含むモデルよりもデータセットによく適合するかどうかを知りたい場合、入れ子になったモデルを実際に使用することがよくあります。
たとえば、上記のシナリオでは、プレー時間、身長、位置、試行ショットを使用して包括的なモデルを当てはめて、バスケットボール選手が得点したポイント数を予測できます。
ただし、位置やシュートの試みからは得点をあまり正確に予測できないのではないかと疑われるかもしれません。
したがって、得点を予測するためにプレー時間と投球のみを使用する入れ子モデルを適合させることができます。
次に、2 つのモデルを比較して、統計的に有意な差があるかどうかを判断できます。
モデル間に有意な差がない場合は、モデルを大幅に改善しないため、予測変数として試行された位置とショットを削除できます。
ネストされたモデルを解析する方法
入れ子になったモデルが「完全な」モデルと大きく異なるかどうかを判断するには、通常、次の帰無仮説と対立仮説を使用する尤度比検定を実行します。
H 0 :完全なモデルとネストされたモデルはデータに同様によく適合します。したがって、ネストされたモデルを使用する必要があります。
H A :完全なモデルは、入れ子になったモデルよりもはるかによくデータに適合します。したがって、完全なテンプレートを使用する必要があります。
尤度比検定では、カイ二乗検定統計量と対応する p 値が生成されます。
検定のp 値が特定の有意レベル (例: 0.05) を下回っている場合、帰無仮説を棄却し、完全なモデルが大幅に良好な適合を提供すると結論付けることができます。
次のチュートリアルでは、R と Python を使用して尤度比テストを実行する方法について説明します。