R で残差プロットを作成する方法


残差プロットは、回帰分析からの残差が正規分布しているかどうか、また残差が不均一分散性を示しているかどうかを評価するためによく使用されます。

このチュートリアルでは、R で回帰モデルの残差プロットを作成する方法について説明します。

例: R の残差プロット

この例では、 mtcars の組み込み R データセットを使用して回帰モデルを近似し、残差を分析するために 3 つの異なる残差プロットを作成します。

ステップ 1: 回帰モデルを当てはめます。

まず、 mpg を応答変数として、 disphpを説明変数として使用して回帰モデルを近似します。

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

ステップ 2: 残差または調整されたプロットを作成します。

次に、不均一分散性 (値の範囲にわたる残差の分布の体系的な変化など) を視覚的に検出するのに役立つ残差/近似プロットを作成します。

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

R の残存または調整された地形

X 軸は近似値を表示し、Y 軸は残差を表示します。グラフから、近似値が高くなるほど残差の分布が高くなる傾向があることがわかりますが、これはモデルに変更を加える必要があるほど深刻ではないようです。

ステップ 3: QQ プロットを作成します。

また、残差が正規分布に従うかどうかを判断するのに役立つ QQ プロットを作成することもできます。プロット内のデータ値が 45 度の角度でほぼ直線に従っている場合、データは正規分布しています。

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

R の残差 Q-Q プロット

残差が裾付近の線からわずかに逸脱する傾向があることがわかります。これは、残差が正規分布ではないことを示している可能性があります。

ステップ 4: 密度プロットを作成します。

また、密度プロットを作成することもできます。これは、残差が正規分布しているかどうかを視覚的に確認するのにも役立ちます。プロットがほぼ釣鐘型の場合、残差はおそらく正規分布に従います。

 #Create density plot of residuals
plot(density(res))

Rの残留濃度曲線

密度プロットは、わずかに右に傾いてはいますが、ほぼ釣鐘型に従っていることがわかります。研究の種類に応じて、研究者は残差がより正規分布するようにデータに変換を実行するかどうかを決定する場合があります。

追加リソース

R で標準化残差を計算する方法
R でスチューデント化残差を計算する方法
R で残差のヒストグラムを作成する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です