部分 f 検定とは何ですか?
部分 F 検定は、回帰モデルと同じモデルのネストされたバージョンの間に統計的に有意な差があるかどうかを判断するために使用されます。
ネストされたモデルは、回帰モデル全体の予測子変数のサブセットを含む単なるモデルです。
たとえば、4 つの予測子変数を含む次の回帰モデルがあるとします。
Y = β 0 + β 1 × 1 + β 2 × 2 + β 3 × 3 + β 4 × 4 + ε
入れ子になったモデルの例は、元の予測子変数が 2 つだけある次のモデルです。
Y = β 0 + β 1 × 1 + β 2 × 2 + ε
これら 2 つのモデルが大きく異なるかどうかを判断するには、部分 F 検定を実行します。
部分 F テスト: 基本
部分 F 検定では、次の F 検定統計量が計算されます。
F = ((縮小RSS –フルRSS)/p) / (フルRSS /nk)
金:
- Reduced RSS : 縮小された (つまり「ネストされた」) モデルの残差二乗和。
- RSS full : フルモデルの残差二乗和。
- p:完全なモデルから削除された予測子の数。
- n:データセット内の観測値の総数。
- k:完全なモデル内の係数の数 (切片を含む)。
予測変数を追加すると常に誤差がある程度減少するため、モデル全体の残差二乗和は常に小さくなることに注意してください。
したがって、部分 F テストは基本的に、完全なモデルから削除した予測子のグループが実際に有用であり、完全なモデルに含めるべきかどうかをテストします。
この検定では、次の帰無仮説と対立仮説を使用します。
H 0 :完全なモデルから削除されたすべての係数はゼロです。
H A :完全なモデルから削除された係数の少なくとも 1 つがゼロ以外です。
F 検定統計量に対応する p 値が特定の有意レベル (0.05 など) を下回っている場合、帰無仮説を棄却し、完全なモデルから削除された係数の少なくとも 1 つが有意であると結論付けることができます。
部分 F 検定: 例
実際には、次の手順を使用して部分 F 検定を実行します。
1.完全な回帰モデルを当てはめて、RSS fullを計算します。
2.ネストされた回帰モデルを適合させ、減少したRSS を計算します。
3. ANOVA を実行して完全モデルと縮小モデルを比較します。これにより、モデルの比較に必要な F 検定統計が生成されます。
たとえば、次のコードは、組み込みのmtcarsデータセットのデータを使用して、次の 2 つの回帰モデルを R で近似する方法を示しています。
フルモデル: mpg = β 0 + β 1利用可能 + β 2炭水化物 + β 3 hp + β 4シリンダー
モデル: mpg = β 0 + 利用可能な β 1 + β 2炭水化物
#fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform ANOVA to test for differences in models anova(model_reduced, model_full) Analysis of Variance Table Model 1: mpg ~ available + carb Model 2: mpg ~ disp + carb + hp + cyl Res.Df RSS Df Sum of Sq F Pr(>F) 1 29 254.82 2 27 238.71 2 16.113 0.9113 0.414
結果から、ANOVA の F 検定統計量は0.9113で、対応する p 値は0.414であることがわかります。
この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。これは、 hpまたはcyl予測変数のいずれかが統計的に有意であると言える十分な証拠がないことを意味します。
言い換えれば、回帰モデルにhpとcylを追加しても、モデルの適合性は大幅には向上しません。