प्रतिगमन विश्लेषण में अवशेषों की गणना कैसे करें


सरल रेखीय प्रतिगमन एक सांख्यिकीय पद्धति है जिसका उपयोग आप दो चर, x और y के बीच संबंध को समझने के लिए कर सकते हैं।

एक चर, x , को भविष्यवक्ता चर के रूप में जाना जाता है। अन्य चर, y , को प्रतिक्रिया चर के रूप में जाना जाता है।

उदाहरण के लिए, मान लीजिए कि हमारे पास सात व्यक्तियों के वजन और ऊंचाई के साथ निम्नलिखित डेटासेट हैं:

सरल रेखीय प्रतिगमन

वजन को पूर्वानुमानक चर होने दें और ऊँचाई को प्रतिक्रिया चर होने दें।

यदि हम x-अक्ष पर भार और y-अक्ष पर ऊंचाई के साथ स्कैटरप्लॉट का उपयोग करके इन दो चरों को ग्राफ़ करते हैं, तो यह इस तरह दिखेगा:

स्कैटरप्लॉट से हम स्पष्ट रूप से देख सकते हैं कि जैसे-जैसे वजन बढ़ता है, ऊंचाई भी बढ़ती है, लेकिन वास्तव में वजन और ऊंचाई के बीच इस संबंध को मापने के लिए हमें रैखिक प्रतिगमन का उपयोग करने की आवश्यकता होती है।

रैखिक प्रतिगमन का उपयोग करके, हम वह रेखा पा सकते हैं जो हमारे डेटा के लिए सबसे उपयुक्त “फिट” होती है:

सर्वोत्तम फ़िट की इस पंक्ति का सूत्र लिखा है:

ŷ = बी 0 + बी 1 एक्स

जहां ŷ प्रतिक्रिया चर का अनुमानित मूल्य है, बी 0 अवरोधन है, बी 1 प्रतिगमन गुणांक है, और एक्स भविष्यवक्ता चर का मूल्य है।

इस उदाहरण में, सबसे अच्छी फिटिंग वाली लाइन है:

आकार = 32.783 + 0.2001*(वजन)

अवशेषों की गणना कैसे करें

ध्यान दें कि हमारे स्कैटरप्लॉट में डेटा बिंदु हमेशा सर्वोत्तम फिट की रेखा के अनुरूप नहीं होते हैं:

डेटा बिंदु और रेखा के बीच के इस अंतर को अवशिष्ट कहा जाता है। प्रत्येक डेटा बिंदु के लिए, हम सर्वोत्तम फिट की रेखा से उसके वास्तविक मूल्य और अनुमानित मूल्य के बीच का अंतर लेकर उस बिंदु के अवशेष की गणना कर सकते हैं।

उदाहरण 1: अवशिष्ट की गणना

उदाहरण के लिए, हमारे डेटासेट में सात व्यक्तियों के वजन और ऊंचाई को याद करें:

सरल रेखीय प्रतिगमन

पहले व्यक्ति का वजन 140 पाउंड है। और ऊंचाई 60 इंच.

इस व्यक्ति की अपेक्षित ऊंचाई का पता लगाने के लिए, हम उनके वजन को सबसे उपयुक्त समीकरण की पंक्ति में जोड़ सकते हैं:

आकार = 32.783 + 0.2001*(वजन)

इस प्रकार, इस व्यक्ति का अनुमानित आकार है:

ऊँचाई = 32.783 + 0.2001*(140)

ऊंचाई = 60.797 इंच

तो, इस डेटा बिंदु के लिए शेष 60 – 60.797 = -0.797 है।

उदाहरण 2: अवशिष्ट की गणना

हम प्रत्येक डेटा बिंदु के लिए शेष की गणना करने के लिए ऊपर उपयोग की गई ठीक उसी प्रक्रिया का उपयोग कर सकते हैं। उदाहरण के लिए, आइए अपने डेटासेट में दूसरे व्यक्ति के लिए शेष की गणना करें:

सरल रेखीय प्रतिगमन

दूसरे व्यक्ति का वजन 155 पाउंड है। और ऊंचाई 62 इंच है.

इस व्यक्ति की अपेक्षित ऊंचाई का पता लगाने के लिए, हम उनके वजन को सबसे उपयुक्त समीकरण की पंक्ति में जोड़ सकते हैं:

आकार = 32.783 + 0.2001*(वजन)

इस प्रकार, इस व्यक्ति का अनुमानित आकार है:

ऊँचाई = 32.783 + 0.2001*(155)

ऊंचाई = 63.7985 इंच

तो इस डेटा बिंदु के लिए शेष 62 – 63.7985 = -1.7985 है।

सभी अवशेषों की गणना करें

पिछले दो उदाहरणों की तरह ही विधि का उपयोग करके, हम प्रत्येक डेटा बिंदु के लिए अवशेषों की गणना कर सकते हैं:

ध्यान दें कि कुछ अवशेष सकारात्मक हैं और अन्य नकारात्मक। यदि हम सभी अवशेषों को जोड़ दें तो उनका योग शून्य होगा।

ऐसा इसलिए है क्योंकि रैखिक प्रतिगमन उस रेखा को ढूंढता है जो अवशेषों के कुल वर्ग को कम करती है, यही कारण है कि रेखा डेटा के माध्यम से पूरी तरह से गुजरती है, कुछ डेटा बिंदु रेखा के ऊपर और अन्य रेखा के नीचे स्थित होते हैं।

अवशेष देखें

याद रखें कि अवशिष्ट केवल डेटा के वास्तविक मूल्य और सर्वोत्तम फिट प्रतिगमन रेखा द्वारा अनुमानित मूल्य के बीच की दूरी है। यहाँ ये दूरियाँ एक बिंदु बादल पर दृश्यमान रूप में कैसी दिखती हैं:

ध्यान दें कि कुछ अवशेष दूसरों की तुलना में बड़े हैं। इसके अतिरिक्त, कुछ अवशेष सकारात्मक हैं और कुछ नकारात्मक हैं, जैसा कि हमने पहले बताया था।

एक अवशिष्ट पथ बनाना

अवशेषों की गणना करने का उद्देश्य यह देखना है कि प्रतिगमन रेखा डेटा को कितनी अच्छी तरह फिट करती है।

बड़े अवशेष इंगित करते हैं कि प्रतिगमन रेखा डेटा को अच्छी तरह से फिट नहीं करती है, अर्थात, वास्तविक डेटा बिंदु प्रतिगमन रेखा का अनुमान नहीं लगाते हैं।

छोटे अवशेष दर्शाते हैं कि प्रतिगमन रेखा डेटा को बेहतर ढंग से फिट करती है, यानी वास्तविक डेटा बिंदु प्रतिगमन रेखा के करीब हैं।

सभी अवशेषों को एक साथ देखने के लिए एक उपयोगी प्रकार का कथानक अवशिष्ट कथानक है। अवशिष्ट प्लॉट एक प्रकार का प्लॉट है जो एक प्रतिगमन मॉडल के लिए अनुमानित मान बनाम अवशिष्ट प्रदर्शित करता है।

इस प्रकार के प्लॉट का उपयोग अक्सर यह मूल्यांकन करने के लिए किया जाता है कि किसी दिए गए डेटा सेट के लिए एक रैखिक प्रतिगमन मॉडल उपयुक्त है या नहीं और अवशेषों की विषमलैंगिकता की जांच करने के लिए।

एक्सेल में एक सरल रैखिक प्रतिगमन मॉडल के लिए अवशिष्ट प्लॉट बनाने का तरीका जानने के लिए इस ट्यूटोरियल को देखें।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *