R에서 스튜던트화 잔차를 계산하는 방법


학생 잔차는 단순히 잔차를 추정된 표준 편차로 나눈 것입니다.

실제로, 우리는 일반적으로 학생 잔차가 절대값 3보다 큰 데이터 세트의 모든 관측치를 이상치라고 말합니다.

다음 구문을 사용하는 MASS 패키지의 Studres() 함수를 사용하여 R에서 모든 회귀 모델의 스튜던트화 잔차를 빠르게 얻을 수 있습니다.

스터드(모델)

여기서 모델은 모든 선형 모델을 나타냅니다.

예: R에서 스튜던트화 잔차 계산

내장된 mtcars 데이터 세트를 사용하여 R에서 다음과 같은 간단한 선형 회귀 모델을 구축한다고 가정합니다.

 #build simple linear regression model
model <- lm(mpg ~ disp, data=mtcars)

MASS 패키지의 Studres() 함수를 사용하여 데이터세트의 각 관측값에 대한 스튜던트화 잔차를 계산할 수 있습니다.

 library (MASS)

#calculate studentized residuals
stud_resids <- studres(model)

#view first three studentized residuals
head(stud_resids, 3)

    Mazda RX4 Mazda RX4 Wag Datsun 710 
   -0.6236250 -0.6236250 -0.7405315 

또한 연구된 해당 잔차에 대한 예측 변수 값의 빠른 플롯을 만들 수도 있습니다.

 #plot predictor variable vs. studentized residuals
plot(mtcars$disp, stud_resids, ylab=' Studentized Residuals ', xlab=' Displacement ') 

#add horizontal line at 0
abline(0, 0) 

R의 스튜던트화 잔기

그래프에서 우리는 어떤 관측치에도 절대값이 3보다 큰 학생 잔차가 없다는 것을 알 수 있습니다. 따라서 데이터 세트에 명확한 이상값이 없습니다.

원하는 경우 원본 데이터세트의 각 관측값에 대한 스튜던트화 잔차를 다시 추가할 수도 있습니다.

 #add studentized residuals to orignal dataset
final_data <- cbind (mtcars[c(' mpg ', ' disp ')], stud_resids)

#view final dataset
head(final_data)

                   mpg disp stud_resids
Mazda RX4 21.0 160 -0.6236250
Mazda RX4 Wag 21.0 160 -0.6236250
Datsun 710 22.8 108 -0.7405315
Hornet 4 Drive 21.4 258 0.7556078
Hornet Sportabout 18.7 360 1.2658336
Valiant 18.1 225 -0.6896297

그런 다음 학생 잔차를 기준으로 각 관측값을 가장 큰 것부터 가장 작은 것까지 정렬하여 어떤 관측값이 이상값에 가장 가까운지에 대한 아이디어를 얻을 수 있습니다.

 #sort studentized residuals descending
final_data[ order (-stud_resids),]

                     mpg disp stud_resids
Toyota Corolla 33.9 71.1 2.52397102
Pontiac Firebird 19.2 400.0 2.06825391
Fiat 128 32.4 78.7 2.03684699
Lotus Europa 30.4 95.1 1.53905536
Honda Civic 30.4 75.7 1.27099586
Hornet Sportabout 18.7 360.0 1.26583364
Chrysler Imperial 14.7 440.0 1.06486066
Hornet 4 Drive 21.4 258.0 0.75560776
Porsche 914-2 26.0 120.3 0.42424678
Fiat X1-9 27.3 79.0 0.30183728
Merc 240D 24.4 146.7 0.26235893
Ford Pantera L 15.8 351.0 0.20825609
Cadillac Fleetwood 10.4 472.0 0.08338531
Lincoln Continental 10.4 460.0 -0.07863385
Duster 360 14.3 360.0 -0.14476167
Merc 450SL 17.3 275.8 -0.28759769
Dodge Challenger 15.5 318.0 -0.30826585
Merc 230 22.8 140.8 -0.30945955
Merc 450SE 16.4 275.8 -0.56742476
AMC Javelin 15.2 304.0 -0.58138205
Camaro Z28 13.3 350.0 -0.58848471
Mazda RX4 Wag 21.0 160.0 -0.62362497
Mazda RX4 21.0 160.0 -0.62362497
Maserati Bora 15.0 301.0 -0.68315010
Valiant 18.1 225.0 -0.68962974
Datsun 710 22.8 108.0 -0.74053152
Merc 450SLC 15.2 275.8 -0.94814699
Toyota Corona 21.5 120.1 -0.99751166
Volvo 142E 21.4 121.0 -1.01790487
Merc 280 19.2 167.6 -1.09979261
Ferrari Dino 19.7 145.0 -1.24732999
Merc 280C 17.8 167.6 -1.57258064

추가 리소스

R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 잔차 플롯을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다