ヌル逸脱と残差逸脱を解釈する方法 (例付き)


一般的な線形モデル (ロジスティック回帰、ポアソン回帰など) を当てはめるたびに、ほとんどの統計ソフトウェアはモデルのゼロ逸脱残差逸脱の値を生成します。

ゼロ逸脱は、元の項のみを含むモデルによって応答変数がどの程度正確に予測できるかを示します。

残差逸脱度は、 p 個の予測子変数を持つモデルによって応答変数がどの程度正確に予測できるかを示します。値が低いほど、モデルは応答変数の値をより適切に予測できます。

モデルが「有用」かどうかを判断するには、次のようにカイ二乗統計量を計算します。

X 2 = ゼロ逸脱 – 残留逸脱

p 個の自由度を持ちます。

次に、このカイ二乗統計量に関連付けられた p 値を見つけることができます。 p 値が低いほど、元の項のみを含むモデルと比較して、モデルはデータセットに適合することができます。

次の例は、R のロジスティック回帰モデルのゼロ逸脱と残差逸脱を解釈する方法を示しています。

例: ゼロおよび残差逸脱の解釈

この例では、ISLR パッケージのデフォルトのデータセットを使用します。次のコードを使用して、データセットの概要を読み込んで表示できます。

 #load dataset
data <- ISLR::Default

#view summary of dataset
summary(data)

 default student balance income     
 No:9667 No:7056 Min. : 0.0 Min. : 772  
 Yes: 333 Yes:2944 1st Qu.: 481.7 1st Qu.:21340  
                       Median: 823.6 Median: 34553  
                       Mean: 835.4 Mean: 33517  
                       3rd Qu.:1166.3 3rd Qu.:43808  
                       Max. :2654.3 Max. :73554 

このデータセットには、10,000 人の個人に関する次の情報が含まれています。

  • デフォルト:個人がデフォルトしたかどうかを示します。
  • 学生:個人が学生であるかどうかを示します。
  • 残高:個人が保有する平均残高。
  • 収入:個人の収入。

学生のステータス、銀行残高、収入を使用して、特定の個人が債務不履行になる確率を予測するロジスティック回帰モデルを構築します。

 #fit logistic regression model
model <- glm(default~balance+student+income, family=" binomial ", data=data)

#view model summary
summary(model)

Call:
glm(formula = default ~ balance + student + income, family = "binomial", 
    data = data)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-2.4691 -0.1418 -0.0557 -0.0203 3.7383  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 ***
balance 5.737e-03 2.319e-04 24.738 < 2e-16 ***
studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** 
income 3.033e-06 8.203e-06 0.370 0.71152    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2920.6 on 9999 degrees of freedom
Residual deviance: 1571.5 on 9996 degrees of freedom
AIC: 1579.5

Number of Fisher Scoring iterations: 8

ゼロおよび残差偏差の出力では次の値を観察できます。

  • ゼロ逸脱: 2920.6 (df = 9999)
  • 残留偏差: 1571.5 (df = 9996)

これらの値を使用して、モデルの X 2統計を計算できます。

  • X 2 = ゼロ逸脱 – 残留逸脱
  • X2 = 2910.6 – 1579.0
  • X2 = 1331.6

予測変数にはp = 3 の自由度があります。

カイ二乗から P 値への計算ツールを使用すると、3 自由度の X 2値 1331.6 の p 値が 0.000000 であることがわかります。

この p 値は 0.05 よりもはるかに小さいため、このモデルは特定の個人が債務不履行になる確率を予測するのに非常に役立つと結論付けられます。

追加リソース

次のチュートリアルでは、R と Python で実際にロジスティック回帰を実行する方法を説明します。

R でロジスティック回帰を実行する方法
Python でロジスティック回帰を実行する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です