回帰モデルの切片を解釈する方法: 例付き
回帰モデルの切片(「定数」と呼ばれることもあります) は、モデル内のすべての予測変数がゼロに等しい場合の応答変数の平均値を表します。
このチュートリアルでは、単回帰モデルと重回帰モデルで元の値を解釈する方法を説明します。
単純線形回帰における交差の解釈
単純な線形回帰モデルは次の形式になります。
ŷ = β 0 + β 1 (x)
金:
- ŷ: 応答変数の予測値
- β 0 : x = 0 の場合の応答変数の平均値
- β 1 : x の 1 単位増加に対する応答変数の平均変化
- x: 予測変数の値
場合によっては、単純な線形回帰モデルで切片値を解釈することが合理的ですが、常にそうとは限りません。次の例はこれを示しています。
例 1: インターセプトを解釈するのは理にかなっています
学習時間を予測変数として、試験のスコアを応答変数として使用して、単純な線形回帰モデルを近似したいとします。
このデータを大学の特定のコースの 50 人の学生から収集し、次の回帰モデルに当てはめます。
試験のスコア = 65.4 + 2.67 (時間)
このモデルの元の項の値は65.4です。これは、学習時間がゼロの場合の試験の平均点は65.4 点であることを意味します。
学生が試験のためにゼロ時間勉強することはもっともらしいので、これは解釈するのが理にかなっています。
例 2: インターセプトは解釈する意味がありません
予測変数として体重(ポンド単位)、応答変数として身長(インチ単位) を使用して、単純な線形回帰モデルを近似したいとします。
このデータを 50 人の個人から収集し、次の回帰モデルを適用します。
高さ = 22.3 + 0.28 (ポンド)
このモデルの元の項の値は22.3です。これは、平均的な人の体重がゼロのときの身長が22.3インチであることを意味します。
人間の体重がゼロポンドになることは不可能であるため、これを解釈するのは意味がありません。
ただし、モデルを使用して予測できるように、モデル内の元の項を保持する必要があります。切片には、このモデルにとって意味のある解釈がありません。
重線形回帰における切片の解釈
重線形回帰モデルは次の形式になります。
ŷ = β 0 + β 1 (x 1 ) + β 2 (x 2 ) + β 3 (x 3 ) + … + β k (x k )
金:
- ŷ: 応答変数の予測値
- β 0 : すべての予測子変数がゼロの場合の応答変数の平均値
- β j : 他のすべての予測子変数が一定のままであると仮定した、j番目の予測子変数の 1 単位増加に対する応答変数の平均変化。
- x j : j番目の予測変数の値
単純な線形回帰と同様に、重回帰モデルの切片値を解釈することが合理的な場合もありますが、常にそうとは限りません。次の例はこれを示しています。
例 1: インターセプトを解釈するのは理にかなっています
学習時間と予備試験を予測変数として、試験のスコアを応答変数として使用して、重線形回帰モデルを近似したいとします。
このデータを大学の特定のコースの 50 人の学生から収集し、次の回帰モデルに当てはめます。
試験のスコア = 58.4 + 2.23 (時間) + 1.34 (予備試験の数)
このモデルの元の項の値は58.4です。これは、学習時間数と受験した予備試験の数が両方とも 0 の場合、試験の平均点は58.4 点であることを意味します。
学生が試験前にゼロ時間勉強し、予備試験を受けないことはもっともらしいので、これは解釈するのが理にかなっています。
例 2: インターセプトは解釈する意味がありません
予測変数として面積と寝室数を、応答変数として販売価格を使用して重線形回帰モデルを近似したいとします。
特定の都市の 100 軒の住宅についてこのデータを収集し、次の回帰モデルを適用します。
価格 = 87,244 + 3.44 (平方フィート) + 843.45 (寝室数)
このモデルの元の項の値は87.244です。これは、家の平方フィートと寝室の数が両方ともゼロに等しい場合、平均住宅販売価格は87,244 ドルであることを意味します。
住宅の平方フィートも寝室もゼロにすることは不可能であるため、これを解釈するのは意味がありません。
ただし、予測に使用するには、元の項をモデル内に保持する必要があります。切片には、このモデルにとって意味のある解釈がありません。