सांख्यिकी में अवशेष क्या हैं?

द्वारा डॉ. बेंजामिन एंडरसन जुलाई 27, 2023 मार्गदर्शक शून्य टिप्पणियां

अवशिष्ट प्रतिगमन विश्लेषण में देखे गए मूल्य और अनुमानित मूल्य के बीच का अंतर है।

इसकी गणना इस प्रकार की जाती है:

अवशिष्ट = प्रेक्षित मूल्य – अनुमानित मूल्य

याद रखें कि रैखिक प्रतिगमन का लक्ष्य एक या अधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को मापना है। ऐसा करने के लिए, रैखिक प्रतिगमन उस रेखा को ढूंढता है जो डेटा को सबसे अच्छी तरह से “फिट” करती है, जिसे कम से कम वर्ग प्रतिगमन रेखा कहा जाता है।

यह रेखा डेटा सेट में प्रत्येक अवलोकन के लिए एक भविष्यवाणी उत्पन्न करती है, लेकिन यह संभावना नहीं है कि प्रतिगमन रेखा द्वारा की गई भविष्यवाणी बिल्कुल देखे गए मूल्य से मेल खाएगी।

पूर्वानुमान और देखे गए मूल्य के बीच का अंतर अवशिष्ट है। यदि हम देखे गए मानों को प्लॉट करते हैं और फिटेड रिग्रेशन लाइन को सुपरइम्पोज़ करते हैं, तो प्रत्येक अवलोकन के लिए अवशेष अवलोकन और रिग्रेशन लाइन के बीच ऊर्ध्वाधर दूरी होगी:

सांख्यिकी में अवशिष्ट का उदाहरण

एक अवलोकन में एक सकारात्मक अवशिष्ट होता है यदि इसका मूल्य प्रतिगमन रेखा द्वारा बनाए गए अनुमानित मूल्य से अधिक है।

इसके विपरीत, यदि किसी अवलोकन का मान प्रतिगमन रेखा द्वारा बनाए गए पूर्वानुमानित मान से कम है, तो उसका अवशिष्ट नकारात्मक होता है।

सकारात्मक या नकारात्मक अवशेष

कुछ अवलोकनों में सकारात्मक अवशेष होंगे जबकि अन्य में नकारात्मक अवशेष होंगे, लेकिन सभी अवशेषों का योग शून्य होगा।

अवशेषों की गणना का उदाहरण

मान लीजिए कि हमारे पास कुल 12 अवलोकनों के साथ निम्नलिखित डेटासेट हैं:

यदि हम इस डेटा सेट में एक रेखीय प्रतिगमन रेखा को फिट करने के लिए सांख्यिकीय सॉफ़्टवेयर (जैसे आर , एक्सेल , पायथन , स्टाटा , आदि) का उपयोग करते हैं, तो हम पाएंगे कि सबसे अच्छी-फिट लाइन यह होगी:

y = 29.63 + 0.7553x

इस पंक्ति का उपयोग करके, हम X के मान के आधार पर प्रत्येक Y मान के लिए अनुमानित मान की गणना कर सकते हैं। उदाहरण के लिए, पहले अवलोकन का अनुमानित मान होगा:

y = 29.63 + 0.7553*(8) = 35.67

फिर हम इस अवलोकन के लिए शेष की गणना इस प्रकार कर सकते हैं:

अवशिष्ट = प्रेक्षित मूल्य – अनुमानित मूल्य = 41 – 35.67 = 5.33

हम प्रत्येक अवलोकन के लिए अवशेष खोजने के लिए इस प्रक्रिया को दोहरा सकते हैं:

अवशेषों की गणना कैसे करें

यदि हम फिट प्रतिगमन रेखा के साथ अवलोकनों को देखने के लिए एक स्कैटरप्लॉट बनाते हैं, तो हम देखेंगे कि कुछ अवलोकन रेखा के ऊपर हैं जबकि अन्य रेखा के नीचे हैं:

अवशिष्ट कथानक के साथ प्रतिगमन रेखा

अवशेषों के गुण

अवशेषों में निम्नलिखित गुण होते हैं:

डेटा सेट में प्रत्येक अवलोकन में एक संगत अवशेष होता है। इसलिए, यदि किसी डेटासेट में कुल 100 अवलोकन हैं, तो मॉडल 100 अनुमानित मान उत्पन्न करेगा, जिसके परिणामस्वरूप कुल 100 अवशेष होंगे।
सभी अवशेषों का योग शून्य है।
अवशेषों का औसत मान शून्य है.

व्यवहार में अवशेषों का उपयोग कैसे किया जाता है?

व्यवहार में, प्रतिगमन में अवशेषों का उपयोग तीन अलग-अलग कारणों से किया जाता है:

1. मॉडल की पर्याप्तता का मूल्यांकन करें.

एक बार जब हम एक फिट प्रतिगमन रेखा तैयार कर लेते हैं, तो हम वर्गों के अवशिष्ट योग (आरएसएस) की गणना कर सकते हैं, जो सभी वर्ग अवशेषों का योग है। आरएसएस जितना कम होगा, प्रतिगमन मॉडल डेटा में उतना ही बेहतर फिट होगा।

2. सामान्यता धारणा की जाँच करें।

रैखिक प्रतिगमन की प्रमुख धारणाओं में से एक यह है कि अवशेष सामान्य रूप से वितरित होते हैं।

इस परिकल्पना का परीक्षण करने के लिए, हम एक QQ प्लॉट बना सकते हैं, जो एक प्रकार का प्लॉट है जिसका उपयोग हम यह निर्धारित करने के लिए कर सकते हैं कि किसी मॉडल के अवशेष सामान्य वितरण का पालन करते हैं या नहीं।

यदि प्लॉट पर बिंदु मोटे तौर पर एक सीधी विकर्ण रेखा बनाते हैं, तो सामान्यता की धारणा पूरी होती है।

3. समरूपता धारणा की जाँच करें।

रैखिक प्रतिगमन की एक अन्य प्रमुख धारणा यह है कि x के प्रत्येक स्तर पर अवशेषों में निरंतर भिन्नता होती है। इसे होमोसेडैस्टिसिटी कहा जाता है। जब ऐसा नहीं होता है, तो अवशेष विषमलैंगिकता से पीड़ित होते हैं।

यह जांचने के लिए कि क्या यह धारणा पूरी हुई है, हम एक अवशिष्ट प्लॉट बना सकते हैं, जो एक स्कैटरप्लॉट है जो मॉडल के अनुमानित मूल्यों के विरुद्ध अवशिष्ट दिखाता है।

**अवशिष्ट और समायोजित मूल्यों को प्लॉट करने का उदाहरण**

यदि ग्राफ़ में अवशेषों को बिना किसी स्पष्ट प्रवृत्ति के लगभग शून्य के आसपास समान रूप से वितरित किया जाता है, तो हम आम तौर पर कहते हैं कि समरूपता की धारणा पूरी हो गई है।

अतिरिक्त संसाधन

सरल रेखीय प्रतिगमन का परिचय
एकाधिक रेखीय प्रतिगमन का परिचय
रैखिक प्रतिगमन की चार धारणाएँ
एक्सेल में एक अवशिष्ट प्लॉट कैसे बनाएं

लेखक के बारे में

डॉ. बेंजामिन एंडरसन

नमस्ते, मैं बेंजामिन हूं, एक सेवानिवृत्त सांख्यिकी प्रोफेसर जो अब समर्पित Statorials शिक्षक बन गया है। सांख्यिकी के क्षेत्र में व्यापक अनुभव और विशेषज्ञता के साथ, मैं Statorials के माध्यम से छात्रों को सशक्त बनाने के लिए अपना ज्ञान साझा करने के लिए उत्सुक हूं। अधिक जाने