スケールと位置のプロットを解釈する方法: 例付き
スケール位置チャートは、 x 軸に沿って回帰モデルの近似値を表示し、y 軸に沿って標準化残差の平方根を表示するチャートの一種です。
このグラフを見ると、次の 2 つのことが確認できます。
1.プロット上で赤い線がほぼ水平であることを確認します。これが当てはまる場合、特定の回帰モデルについて等分散性の仮定が満たされる可能性があります。つまり、残差の分布はすべての近似値でほぼ等しくなります。
2.残差間に明確な傾向がないことを確認します。言い換えれば、残差は、すべての近似値に対してほぼ等しい変動性で赤い線の周囲にランダムに散在する必要があります。
R でのスケールと位置のプロット
次のコードを使用して、R で単純な線形回帰モデルを近似し、結果のモデルのスケールと位置のプロットを生成できます。
#fit simple linear regression model model <- lm(Ozone ~ Temp, data = airquality) #produce scale-location plot plot(model)
この回帰モデルのスケールと位置のプロットから、次の 2 つのことがわかります。
1.赤い線はプロット上でほぼ水平です。これが当てはまる場合、特定の回帰モデルについて等分散性の仮定が満たされます。つまり、残差の分布はすべての近似値でほぼ等しくなります。
2.残差間に明確な傾向がないことを確認します。言い換えれば、残差は、すべての近似値に対してほぼ等しい変動性で赤い線の周囲にランダムに散在する必要があります。
技術的なメモ
グラフでは、標準化残差が最も高いデータセットからの 3 つの観測値がラベル付けされています。
行 30、62、および 117 の観測値が最も高い標準化残差を持っていることがわかります。
これは必ずしもこれらの観測値が外れ値であることを意味するわけではありませんが、これらの観測値をより詳しく調べるために元のデータを確認することもできます。
スケール位置プロットでは赤い線がほぼ水平であることがわかりますが、これは等分散性の仮定が満たされているかどうかを視覚的に確認する方法としてのみ機能します。
等分散性の仮定が満たされているかどうかを確認するために使用できる正式な統計検定は、 Breusch-Pagan 検定です。
R の Breusch-Pagan テスト
次のコードは、 lmtestパッケージのbptest()関数を使用して、R で Breusch-Pagan テストを実行する方法を示しています。
#load lmtest package library(lmtest) #perform Breusch-Pagan Test bptest(model) studentized Breusch-Pagan test data: model BP = 1.4798, df = 1, p-value = 0.2238
Breusch-Pagan 検定では、次の帰無仮説と対立仮説が使用されます。
- 帰無仮説 (H 0 ): 残差は等分散的 (つまり、一様に分布している)
- 対立仮説 ( HA ): 残差は不均一分散である (つまり、均一に分布していない)
結果から、検定の p 値は0.2238であることがわかります。この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。回帰モデルに不均一分散性が存在すると主張する十分な証拠はありません。
この結果は、スケールと位置のプロットの赤い線の目視検査と一致します。
追加リソース
回帰分析における不均一分散性の理解
R で残差プロットを作成する方法
R で Breusch-Pagan テストを実行する方法