二乗和の優しいガイド: sst、ssr、sse
線形回帰は、一連のデータに最もよく「適合」する直線を見つけるために使用されます。
回帰直線が実際にデータにどの程度適合するかを測定するために、3 つの異なる平方和値を使用することがよくあります。
1. 総平方和 (SST) –個々のデータ ポイント (y i ) と応答変数の平均 ( y ) の間の差の平方和。
- SST = Σ(y i – y ) 2
2. 二乗和回帰 (SSR) – 予測されたデータ点 (ŷ i ) と応答変数の平均 ( y ) の差の二乗和。
- SSR = Σ(ŷ i – y ) 2
3. 二乗和誤差 (SSE) – 予測データ ポイント (ŷ i ) と観測データ ポイント (y i ) の差の二乗和。
- SSE = Σ(ŷ i – y i ) 2
これら 3 つのメジャーの間には次の関係が存在します。
SST = SSR + SSE
したがって、これらの測定値のうち 2 つがわかっていれば、簡単な代数を使用して 3 番目の測定値を計算できます。
SSR、SST、Rスクエア
R 二乗(決定係数とも呼ばれる) は、線形回帰モデルがデータセットにどの程度適合するかを示す尺度です。これは、予測変数によって説明できる応答変数の分散の割合を表します。
R 二乗値の範囲は 0 ~ 1 です。値 0 は、応答変数が予測変数によってまったく説明できないことを示します。値 1 は、応答変数が予測変数によって誤差なく完全に説明できることを示します。
SSR と SST を使用すると、次のように R の 2 乗を計算できます。
R の 2 乗 = SSR / SST
たとえば、特定の回帰モデルの SSR が 137.5 で、SST が 156 の場合、R の 2 乗は次のように計算されます。
R 2 乗 = 137.5 / 156 = 0.8814
これは、応答変数の変動の 88.14% が予測変数によって説明できることを示しています。
SST、SSR、SSE の計算:ステップバイステップの例
6 人の異なる学生の勉強時間数と最終試験の得点を示す次のデータセットがあるとします。
いくつかの統計ソフトウェア ( R 、 Excel 、 Pythonなど) を使用するか、手動でも、最適な直線は次のとおりであることがわかります。
スコア = 66.615 + 5.0769*(時間)
最適な方程式の直線がわかったら、次の手順を使用して SST、SSR、および SSE を計算できます。
ステップ 1: 応答変数の平均を計算します。
応答変数 ( y ) の平均は81であることがわかります。
ステップ 2: 各観測値の予測値を計算します。
次に、最良適合方程式の直線を使用して、各生徒の予測試験スコア () を計算できます。
たとえば、1 時間勉強した生徒の予想される試験成績は次のとおりです。
スコア = 66.615 + 5.0769*(1) = 71.69 。
同じアプローチを使用して、各生徒の予測スコアを見つけることができます。
ステップ 3: 二乗総和 (SST) を計算します。
次に、合計の平方和を計算できます。
たとえば、最初の生徒の平方和の合計は次のようになります。
(y i – y ) 2 = (68 – 81) 2 = 169 。
同じアプローチを使用して、各生徒の平方和の合計を求めることができます。
二乗和の合計は316となります。
ステップ 4: 二乗和回帰 (SSR) を計算します。
次に、二乗和回帰を計算できます。
たとえば、最初の生徒の二乗和回帰は次のようになります。
( ŷi – y ) 2 = (71.69 – 81) 2 = 86.64 。
同じアプローチを使用して、各生徒の平方和の回帰を見つけることができます。
二乗和回帰は279.23であることがわかります。
ステップ 5: 平方和誤差 (SSE) を計算します。
次に、二乗和の誤差を計算できます。
たとえば、最初の生徒の平方和誤差は次のようになります。
(ŷ i – y i ) 2 = (71.69 – 68) 2 = 13.63 。
同じアプローチを使用して、各生徒の平方和誤差を見つけることができます。
SST = SSR + SSE であることを確認できます。
- SST = SSR + SSE
- 316 = 279.23 + 36.77
次の方程式を使用して、回帰モデルの R 2 乗を計算することもできます。
- R の 2 乗 = SSR / SST
- R の 2 乗 = 279.23 / 316
- R の 2 乗 = 0.8836
これは、試験の得点の変動の88.36%が勉強時間によって説明できることがわかります。
追加リソース
次の計算ツールを使用すると、任意の単純な線形回帰直線の SST、SSR、および SSE を自動的に計算できます。
SST計算機
RSS計算機
ESS計算機