आर में छात्रकृत अवशेषों की गणना कैसे करें


एक छात्र अवशेष केवल उसके अनुमानित मानक विचलन से विभाजित एक अवशेष है।

व्यवहार में, हम आम तौर पर कहते हैं कि डेटा सेट में कोई भी अवलोकन जिसका छात्र अवशेष 3 के निरपेक्ष मान से अधिक है, एक बाहरी है।

हम MASS पैकेज से studres() फ़ंक्शन का उपयोग करके R में किसी भी प्रतिगमन मॉडल के छात्रकृत अवशेषों को तुरंत प्राप्त कर सकते हैं, जो निम्नलिखित सिंटैक्स का उपयोग करता है:

छात्र(मॉडल)

जहां मॉडल किसी रैखिक मॉडल का प्रतिनिधित्व करता है।

उदाहरण: आर में छात्रकृत अवशेषों की गणना

मान लीजिए कि हम अंतर्निहित एमटीकार्स डेटासेट का उपयोग करके आर में निम्नलिखित सरल रैखिक प्रतिगमन मॉडल बनाते हैं:

 #build simple linear regression model
model <- lm(mpg ~ disp, data=mtcars)

हम डेटासेट में प्रत्येक अवलोकन के लिए छात्रकृत अवशेषों की गणना करने के लिए MASS पैकेज से studres() फ़ंक्शन का उपयोग कर सकते हैं:

 library (MASS)

#calculate studentized residuals
stud_resids <- studres(model)

#view first three studentized residuals
head(stud_resids, 3)

    Mazda RX4 Mazda RX4 Wag Datsun 710 
   -0.6236250 -0.6236250 -0.7405315 

हम संबंधित अध्ययन किए गए अवशेषों के विरुद्ध भविष्यवक्ता चर के मूल्यों का एक त्वरित प्लॉट भी बना सकते हैं:

 #plot predictor variable vs. studentized residuals
plot(mtcars$disp, stud_resids, ylab=' Studentized Residuals ', xlab=' Displacement ') 

#add horizontal line at 0
abline(0, 0) 

आर में विद्यार्थीकृत अवशेष

ग्राफ़ से हम देख सकते हैं कि किसी भी अवलोकन में 3 से अधिक निरपेक्ष मान वाला कोई छात्र अवशेष नहीं है, इसलिए डेटासेट में कोई स्पष्ट आउटलेयर नहीं हैं।

यदि हम चाहें तो हम मूल डेटासेट में प्रत्येक अवलोकन के छात्रकृत अवशेषों को भी वापस जोड़ सकते हैं:

 #add studentized residuals to orignal dataset
final_data <- cbind (mtcars[c(' mpg ', ' disp ')], stud_resids)

#view final dataset
head(final_data)

                   mpg disp stud_resids
Mazda RX4 21.0 160 -0.6236250
Mazda RX4 Wag 21.0 160 -0.6236250
Datsun 710 22.8 108 -0.7405315
Hornet 4 Drive 21.4 258 0.7556078
Hornet Sportabout 18.7 360 1.2658336
Valiant 18.1 225 -0.6896297

फिर हम प्रत्येक अवलोकन को उसके छात्र अवशेष के आधार पर सबसे बड़े से सबसे छोटे में क्रमबद्ध कर सकते हैं ताकि यह पता चल सके कि कौन से अवलोकन आउटलेर्स के सबसे करीब हैं:

 #sort studentized residuals descending
final_data[ order (-stud_resids),]

                     mpg disp stud_resids
Toyota Corolla 33.9 71.1 2.52397102
Pontiac Firebird 19.2 400.0 2.06825391
Fiat 128 32.4 78.7 2.03684699
Lotus Europa 30.4 95.1 1.53905536
Honda Civic 30.4 75.7 1.27099586
Hornet Sportabout 18.7 360.0 1.26583364
Chrysler Imperial 14.7 440.0 1.06486066
Hornet 4 Drive 21.4 258.0 0.75560776
Porsche 914-2 26.0 120.3 0.42424678
Fiat X1-9 27.3 79.0 0.30183728
Merc 240D 24.4 146.7 0.26235893
Ford Pantera L 15.8 351.0 0.20825609
Cadillac Fleetwood 10.4 472.0 0.08338531
Lincoln Continental 10.4 460.0 -0.07863385
Duster 360 14.3 360.0 -0.14476167
Merc 450SL 17.3 275.8 -0.28759769
Dodge Challenger 15.5 318.0 -0.30826585
Merc 230 22.8 140.8 -0.30945955
Merc 450SE 16.4 275.8 -0.56742476
AMC Javelin 15.2 304.0 -0.58138205
Camaro Z28 13.3 350.0 -0.58848471
Mazda RX4 Wag 21.0 160.0 -0.62362497
Mazda RX4 21.0 160.0 -0.62362497
Maserati Bora 15.0 301.0 -0.68315010
Valiant 18.1 225.0 -0.68962974
Datsun 710 22.8 108.0 -0.74053152
Merc 450SLC 15.2 275.8 -0.94814699
Toyota Corona 21.5 120.1 -0.99751166
Volvo 142E 21.4 121.0 -1.01790487
Merc 280 19.2 167.6 -1.09979261
Ferrari Dino 19.7 145.0 -1.24732999
Merc 280C 17.8 167.6 -1.57258064

अतिरिक्त संसाधन

आर में सरल रैखिक प्रतिगमन कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
आर में अवशिष्ट प्लॉट कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *