Excel で標準化残差を計算する方法
残差は、回帰モデルにおける観測値と予測値の差です。
次のように計算されます。
残差 = 観測値 – 予測値
観測値をプロットし、近似された回帰直線を重ね合わせると、各観測値の残差は観測値と回帰直線の間の垂直距離になります。
回帰モデルで外れ値を特定するためによく使用される残差の 1 つのタイプは、標準化残差と呼ばれます。
次のように計算されます。
r i = e i / s(e i ) = e i / RSE√ 1-h ii
金:
- e i : i 番目の剰余
- RSE:モデルの残差標準誤差
- h ii : i 番目の観測の立ち上がり
実際には、絶対値が 3 より大きい標準化残差を外れ値と見なすことがよくあります。
このチュートリアルでは、Excel で標準化残差を計算する方法を段階的に説明します。
ステップ 1: データを入力する
まず、小さなデータセットの値を Excel に入力します。
ステップ 2: 残差を計算する
次に、上部のリボンに沿って[データ]タブに移動し、 [分析]グループの[データ分析]をクリックします。
このアドインをまだインストールしていない場合は、 このチュートリアルを参照して方法を学習してください。インストールは簡単で完全に無料です。
[データ分析] をクリックしたら、 [回帰]というオプションをクリックし、 [OK]をクリックします。表示される新しいウィンドウに次の情報を入力し、 [OK]をクリックします。
各観測値の残差が結果に表示されます。
これらの残差をコピーして、元のデータの隣の新しい列に貼り付けます。
ステップ 3: レバレッジを計算する
次に、各観測値のレバレッジを計算する必要があります。
次の図は、これを行う方法を示しています。
さまざまなセルで使用される数式は次のとおりです。
- B14: =COUNT(B2:B13)
- B15: = 平均 (B2: B13)
- B16: =DEVSQ(B2:B13)
- E2: =1/$B$14+(B2-$B$15)^2/$B$16
ステップ 4: 標準化残差を計算する
最後に、次の式を使用して標準化残差を計算できます。
r i = e i / RSE√ 1-h ii
モデルのCSR は、以前のモデルの結果で確認できます。 4.44であることがわかります。
したがって、次の式を使用して、各観測値の標準化残差を計算できます。
結果から、標準化された残差はいずれも絶対値 3 を超えていないことがわかります。したがって、どの観測値も外れ値であるように見えません。
場合によっては、研究者が標準化残差が絶対値 2 を超える観測値を外れ値とみなす場合があることに注意してください。
取り組んでいる特定の問題に応じて、外れ値のしきい値として絶対値 2 を使用するか 3 を使用するかはユーザー次第です。