अवशिष्ट/लीवरेज चार्ट क्या है? (परिभाषा & #038; उदाहरण)


अवशिष्ट बनाम उत्तोलन का एक प्लॉट एक प्रकार का डायग्नोस्टिक चार्ट है जो हमें प्रतिगमन मॉडल में प्रभावशाली टिप्पणियों की पहचान करने की अनुमति देता है।

सांख्यिकीय प्रोग्रामिंग भाषा आर में इस प्रकार का प्लॉट इस प्रकार दिखाई देता है:

डेटासेट में प्रत्येक अवलोकन को प्लॉट में एक बिंदु के रूप में प्रदर्शित किया जाता है। x-अक्ष प्रत्येक बिंदु का उत्तोलन दिखाता है और y-अक्ष प्रत्येक बिंदु का मानकीकृत अवशेष दिखाता है।

उत्तोलन उस सीमा को संदर्भित करता है जिस हद तक प्रतिगमन मॉडल के गुणांक बदल जाएंगे यदि किसी विशेष अवलोकन को डेटा सेट से हटा दिया जाए।

उच्च उत्तोलन वाली टिप्पणियों का प्रतिगमन मॉडल के गुणांकों पर एक मजबूत प्रभाव पड़ता है। यदि हम इन अवलोकनों को हटा दें, तो मॉडल गुणांक महत्वपूर्ण रूप से बदल जाएंगे।

मानकीकृत अवशेष किसी अवलोकन के लिए अनुमानित मूल्य और अवलोकन के वास्तविक मूल्य के बीच मानकीकृत अंतर को संदर्भित करते हैं।

यह ध्यान दिया जाना चाहिए कि एक अवलोकन में मानकीकृत अवशिष्ट के लिए उच्च निरपेक्ष मूल्य हो सकता है, लेकिन उत्तोलन के लिए कम मूल्य हो सकता है।

अवशिष्ट बनाम उत्तोलन ग्राफ की व्याख्या कैसे करें

यदि इस ग्राफ़ पर कोई बिंदु कुक दूरी (लाल बिंदीदार रेखाएं) के बाहर आता है, तो इसे एक प्रभावशाली अवलोकन माना जाता है।

आइए पहले दिखाए गए अवशिष्ट बनाम उत्तोलन ग्राफ का संदर्भ लें:

उपरोक्त उदाहरण में, हम देख सकते हैं कि अवलोकन #10 कुक दूरी सीमा के सबसे करीब है, लेकिन यह बिंदीदार रेखा से बाहर नहीं जाता है। इसका मतलब यह है कि हमारे प्रतिगमन मॉडल में कोई प्रभावशाली बिंदु नहीं हैं

हालाँकि, मान लीजिए कि हमारे पास निम्नलिखित अवशिष्ट/उत्तोलन ग्राफ है:

हम देख सकते हैं कि ऊपरी दाएं कोने में अवलोकन #1 लाल बिंदीदार रेखाओं के बाहर है। इससे पता चलता है कि यह प्रभाव का बिंदु है

इसका मतलब यह है कि अगर हमने इस अवलोकन को अपने डेटासेट से हटा दिया और प्रतिगमन मॉडल को फिर से फिट किया, तो मॉडल गुणांक महत्वपूर्ण रूप से बदल जाएगा।

प्रभावशाली टिप्पणियों को कैसे संभालें

यदि आप किसी मॉडल के लिए अवशिष्ट बनाम उत्तोलन का एक प्लॉट बनाते हैं और देखते हैं कि एक या अधिक अवलोकनों को प्रभावशाली के रूप में पहचाना जाता है, तो आप कई चीजें कर सकते हैं:

1. सत्यापित करें कि अवलोकन कोई त्रुटि नहीं है।

कोई भी कार्रवाई करने से पहले, आपको पहले यह सत्यापित करना चाहिए कि प्रभावशाली अवलोकन डेटा प्रविष्टि त्रुटि या अन्य अजीब घटना का परिणाम नहीं हैं।

2. किसी अन्य प्रतिगमन मॉडल को फिट करने का प्रयास करें।

प्रभावशाली अवलोकन यह संकेत दे सकते हैं कि आपके द्वारा निर्दिष्ट मॉडल डेटा में अच्छी तरह से फिट नहीं बैठता है। इस मामले में, आप एक बहुपद प्रतिगमन मॉडल या एक अरेखीय मॉडल आज़मा सकते हैं।

3. प्रभावशाली टिप्पणियाँ हटाएँ.

अंत में, यदि एक या दो प्रभावशाली टिप्पणियों को छोड़कर, आपके द्वारा निर्दिष्ट मॉडल डेटा में अच्छी तरह से फिट बैठता है, तो आप प्रभावशाली टिप्पणियों को हटाने का निर्णय ले सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल प्रतिगमन मॉडल के फिट का मूल्यांकन करने के लिए अवशेषों का उपयोग करने के तरीके के बारे में अतिरिक्त जानकारी प्रदान करते हैं।

सांख्यिकी में अवशेष क्या हैं?
मानकीकृत अवशेष क्या हैं?
आर में डायग्नोस्टिक प्लॉट की व्याख्या कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *