回帰における全体的な有意性の f 検定を理解するための簡単なガイド
このチュートリアルでは、回帰テーブルの出力で F 統計量を特定する方法と、この統計量と対応する p 値を解釈する方法について説明します。
全体的な有意性 F 検定の理解
回帰における全体的な有意性の F 検定は、線形回帰モデルが予測変数を持たないモデルよりもデータセットによく適合するかどうかを判断する検定です。
全体的な有意性 F 検定は、次の 2 つの仮定に基づいています。
帰無仮説 ( H0 ):予測変数を含まないモデル (切片のみのモデルとも呼ばれます) は、回帰モデルと同様にデータに適合します。
対立仮説 ( HA ):回帰モデルは、切片のみのモデルよりもデータによく適合します。
回帰モデルをデータセットに適合させると、出力として回帰表を受け取ります。これにより、F 統計量とその F 統計量に対応する p 値がわかります。
p 値が選択した有意水準 (一般的な選択は 0.01、0.05、および 0.10 ) より小さい場合、回帰モデルが元のモデルとしてのみデータに適合すると結論付けるのに十分な証拠があります。モデル。
例: 回帰における F 検定
12 人の異なる学生の合計学習時間数、受けた予備試験の合計数、および最終試験の成績を示す次のデータ セットがあるとします。
学習時間と予備試験の受験時間と学生が取得した最終試験の成績との関係を分析するには、学習時間と予備試験の受験時間を予測変数として、試験中の最終成績を応答変数として使用して重線形回帰を実行します。
次の結果が得られます。
これらの結果から、ANOVA 表に示されている F 統計量と、表内でF 有意性としてラベル付けされているこの F 統計量の p 値に焦点を当てます。有意水準として 0.05 を選択します。
F 統計: 5.090515
P 値: 0.0332
技術的な注意: F 統計は、MS 回帰を MS 残差で割ったものとして計算されます。この場合、MS 回帰 / MS 残差 = 273.2665 / 53.68151 = 5.090515となります。
p 値が有意水準を下回っているため、回帰モデルは切片のみのモデルよりもデータによく適合していると結論付けることができます。
この特定の問題のコンテキストでは、これは、モデルで学習時間と予備試験の予測変数を使用すると、それらを省略して単に切片モデルを独自に使用した場合よりもデータをより適切に適合できることを意味します。
全体有意性の F 検定の解釈に関する注意事項
一般に、どの予測変数も統計的に有意でない場合、全体の F 検定も統計的に有意ではありません。
ただし、場合によっては当てはまらない場合があります。これは、全体の有意性の F 検定ではすべての予測変数が共同で有意であるかどうかが検定されるのに対し、個々の予測変数の有意性の T 検定では各予測変数が有意であるかどうかが単純に検定されるためです。個々に重要です。
したがって、F 検定は、すべての予測子変数が結合して有意であるかどうかを判断します。
各予測子変数が有意ではないにもかかわらず、F 検定により、結合されたすべての予測子変数が合わせて有意であることが示される可能性があります。
技術的なメモ:一般に、モデル内の予測変数が多いほど、F 統計量と対応する p 値が統計的に有意になる確率が高くなります。
回帰の出力でよく見られるもう 1 つの指標はR 二乗です。これは、予測変数と応答変数の間の線形関係の強さを測定するものです。
R 二乗は、予測変数が応答変数とどの程度強く関連しているかを知ることができますが、この関係についての正式な統計検定は提供しません。
F テストが正式な統計テストであるため、F テストが役立つのはこのためです。さらに、全体的な F 検定が有意であれば、R 二乗はゼロではなく、予測変数と応答変数の間の相関は統計的に有意であると結論付けることができます。
追加リソース
次のチュートリアルでは、回帰モデルの他の一般的な値を解釈する方法を説明します。