回帰傾きの信頼区間を計算する方法
単純な線形回帰は、予測変数と応答変数の間の関係を定量化するために使用されます。
このメソッドは、一連のデータに最もよく「一致」する行を検索し、次の形式を取ります。
ŷ = b 0 + b 1 x
金:
- ŷ : 推定応答値
- b 0 : 回帰直線の原点
- b 1 : 回帰直線の傾き
- x : 予測変数の値
私たちはしばしば b 1の値に興味を持ちます。これは、予測変数の 1 単位の増加に関連する応答変数の平均変化を示します。
次の式を使用して、母集団全体の傾き値である β 1の値の信頼区間を計算できます。
β 1の信頼区間: b 1 ± t 1-α/2, n-2 * se(b 1 )
金:
- b 1 = 回帰表に示される傾き係数
- t 1-∝/2, n-2 = n-2 自由度の 1-∝ 信頼水準の臨界 t 値。nはデータセット内の観測値の総数です。
- se(b 1 ) = 回帰表に示される b 1の標準誤差
次の例は、実際に回帰勾配の信頼区間を計算する方法を示しています。
例: 回帰傾きの信頼区間
特定のクラスの 15 人の生徒について、学習時間を予測変数として使用し、試験の得点を応答変数として使用して、単純な線形回帰モデルを近似したいとします。
Excel で単純な線形回帰を実行すると、次の結果が得られます。
結果の係数推定値を使用すると、次のように近似単純線形回帰モデルを作成できます。
スコア = 65.334 + 1.982*(学習時間)
回帰勾配の値は1.982です。
これは、学習時間が 1 時間増えるごとに、試験のスコアが平均1,982点増加することを示しています。
次の式を使用して、傾きの 95% 信頼区間を計算できます。
- β 1の 95% CI: b 1 ± t 1-α/2, n-2 * se(b 1 )
- β 1の 95% CI: 1.982 ± t 0.975、15-2 * 0.248
- β 1の 95% CI: 1.982 ± 2.1604 * 0.248
- β 1の 95% CI: [1.446, 2.518]
回帰勾配の 95% 信頼区間は[1.446, 2.518]です。
この信頼区間には値 0 が含まれていないため、学習時間と試験の成績の間には統計的に有意な関連があると結論付けることができます。
注: 逆 t 分布計算ツールを使用して、13 自由度で 95% の信頼水準に対応する臨界 t 値を見つけました。
追加リソース
次のチュートリアルでは、線形回帰に関する追加情報を提供します。