R で残差プロットを作成する方法
残差プロットは、回帰分析からの残差が正規分布しているかどうか、また残差が不均一分散性を示しているかどうかを評価するためによく使用されます。
このチュートリアルでは、R で回帰モデルの残差プロットを作成する方法について説明します。
例: R の残差プロット
この例では、 mtcars の組み込み R データセットを使用して回帰モデルを近似し、残差を分析するために 3 つの異なる残差プロットを作成します。
ステップ 1: 回帰モデルを当てはめます。
まず、 mpg を応答変数として、 dispとhpを説明変数として使用して回帰モデルを近似します。
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #get list of residuals res <- resid(model)
ステップ 2: 残差または調整されたプロットを作成します。
次に、不均一分散性 (値の範囲にわたる残差の分布の体系的な変化など) を視覚的に検出するのに役立つ残差/近似プロットを作成します。
#produce residual vs. fitted plot plot(fitted(model), res) #add a horizontal line at 0 abline(0,0)
X 軸は近似値を表示し、Y 軸は残差を表示します。グラフから、近似値が高くなるほど残差の分布が高くなる傾向があることがわかりますが、これはモデルに変更を加える必要があるほど深刻ではないようです。
ステップ 3: QQ プロットを作成します。
また、残差が正規分布に従うかどうかを判断するのに役立つ QQ プロットを作成することもできます。プロット内のデータ値が 45 度の角度でほぼ直線に従っている場合、データは正規分布しています。
#create QQ plot for residuals qqnorm(res) #add a straight diagonal line to the plot qqline(res)
残差が裾付近の線からわずかに逸脱する傾向があることがわかります。これは、残差が正規分布ではないことを示している可能性があります。
ステップ 4: 密度プロットを作成します。
また、密度プロットを作成することもできます。これは、残差が正規分布しているかどうかを視覚的に確認するのにも役立ちます。プロットがほぼ釣鐘型の場合、残差はおそらく正規分布に従います。
#Create density plot of residuals
plot(density(res))
密度プロットは、わずかに右に傾いてはいますが、ほぼ釣鐘型に従っていることがわかります。研究の種類に応じて、研究者は残差がより正規分布するようにデータに変換を実行するかどうかを決定する場合があります。