곡선 잔차 그림을 해석하는 방법(예제 포함)


잔차 도표는 회귀 모델의 잔차가 정규 분포를 따르는지 여부와 이분산성을 나타내는지 여부를 평가하는 데 사용됩니다.

이상적으로는 잔차 그림의 점이 명확한 패턴 없이 값 0 주위에 무작위로 흩어져 있기를 원할 것입니다.

플롯 포인트에 곡선 패턴이 있는 잔차 플롯이 나타나면 데이터에 대해 지정한 회귀 모델이 올바르지 않음을 의미할 수 있습니다.

대부분의 경우 이는 선형 회귀 모델을 2차 추세를 따르는 데이터 세트에 맞추려고 시도했음을 의미합니다.

다음 예에서는 곡선 잔차 그림을 실제로 해석하고 수정하는 방법을 보여줍니다.

예: 곡선 잔차 그림 해석

사무실에 있는 11명의 서로 다른 사람들에 대해 주당 근무 시간과 보고된 행복 수준(0~100 범위)에 대한 다음 데이터를 수집한다고 가정해 보겠습니다.

근무 시간 대 행복 수준에 대한 간단한 산점도를 만든 경우 다음과 같습니다.

이제 행복 수준을 예측하기 위해 근무 시간을 사용하여 회귀 모델을 적합화한다고 가정합니다.

다음 코드는 간단한 선형 회귀 모델을 이 데이터 세트에 맞추고 R에서 잔차 플롯을 생성하는 방법을 보여줍니다.

 #create dataframe
df <- data. frame (hours=c(6, 9, 12, 14, 30, 35, 40, 47, 51, 55, 60),
                 happiness=c(14, 28, 50, 70, 89, 94, 90, 75, 59, 44, 27))
#fit linear regression model
linear_model <- lm(happiness ~ hours, data=df)

#get list of residuals 
res <- resid(linear_model)

#produce residual vs. fitted plot
plot(fitted(linear_model), res, xlab=' Fitted Values ', ylab=' Residuals ')

#add a horizontal line at 0 
abline(0,0)

곡선 잔차 그림

x축은 적합치를 표시하고 y축은 잔차를 표시합니다.

그래프에서 잔차에 곡선 패턴이 있음을 알 수 있는데, 이는 선형 회귀 모델이 이 데이터 세트에 적합한 피팅을 제공하지 않음을 나타냅니다.

다음 코드는 이 데이터 세트에 2차 회귀 모델을 맞추고 R에서 잔차 플롯을 생성하는 방법을 보여줍니다.

 #create dataframe
df <- data. frame (hours=c(6, 9, 12, 14, 30, 35, 40, 47, 51, 55, 60),
                 happiness=c(14, 28, 50, 70, 89, 94, 90, 75, 59, 44, 27))
#define quadratic term to use in model
df$hours2 <- df$hours^2

#fit quadratic regression model
quadratic_model <- lm(happiness ~ hours + hours2, data=df)

#get list of residuals 
res <- resid(quadratic_model)

#produce residual vs. fitted plot
plot(fitted(quadratic_model), res, xlab=' Fitted Values ', ylab=' Residuals ')

#add a horizontal line at 0 
abline(0,0) 

다시 한번, x축은 적합치를 나타내고 y축은 잔차를 나타냅니다.

플롯에서 잔차가 0 주위에 무작위로 흩어져 있고 잔차에 명확한 추세가 없음을 알 수 있습니다.

이는 2차 회귀 모델이 선형 회귀 모델보다 이 데이터 세트를 더 잘 피팅한다는 것을 알려줍니다.

근무 시간과 행복 수준 사이의 실제 관계가 선형이 아닌 2차 관계인 것처럼 보인다는 점을 고려하면 이는 의미가 있습니다.

추가 리소스

다음 자습서에서는 다양한 통계 소프트웨어를 사용하여 잔차 그림을 만드는 방법을 설명합니다.

손으로 잔여 경로를 만드는 방법
R에서 잔차 플롯을 만드는 방법
Excel에서 잔차 도표를 만드는 방법
Python에서 잔차 플롯을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다