एकाधिक रेखीय प्रतिगमन
यह आलेख बताता है कि आंकड़ों में एकाधिक रैखिक प्रतिगमन क्या है। इसके अतिरिक्त, आप सीखेंगे कि एकाधिक रैखिक प्रतिगमन मॉडल कैसे बनाया जाता है और इसकी व्याख्या कैसे की जाती है।
एकाधिक रैखिक प्रतिगमन क्या है?
मल्टीपल लीनियर रिग्रेशन एक रिग्रेशन मॉडल है जिसमें दो या दो से अधिक स्वतंत्र चर शामिल होते हैं। दूसरे शब्दों में, मल्टीपल लीनियर रिग्रेशन एक सांख्यिकीय मॉडल है जो कई व्याख्यात्मक चर को प्रतिक्रिया चर से रैखिक रूप से जोड़ने की अनुमति देता है।
इसलिए, एक बहु रेखीय प्रतिगमन मॉडल का उपयोग एक समीकरण खोजने के लिए किया जाता है जो दो या दो से अधिक स्वतंत्र चर को एक आश्रित चर से संबंधित करता है। इस प्रकार, प्रत्येक स्वतंत्र चर के मान को प्रतिस्थापित करके, आश्रित चर के मान का एक अनुमान प्राप्त किया जाता है।
उदाहरण के लिए, समीकरण y=3+6x 1 -4x 2 +7x 3 एक बहु रेखीय प्रतिगमन मॉडल है क्योंकि यह गणितीय रूप से तीन स्वतंत्र चर (x 1 , x 2 , x 3 ) को एक आश्रित चर (y) रैखिक मान पथ से जोड़ता है। .
एकाधिक रेखीय प्रतिगमन सूत्र
एकाधिक रैखिक प्रतिगमन मॉडल के लिए समीकरण y=β 0 +β 1 x 1 +β 2 x 2 +…+β m x m +ε है।
सोना:
-
आश्रित चर है.
-
स्वतंत्र चर है i.
-
बहुरेखीय प्रतिगमन समीकरण का स्थिरांक है।
-
चर से जुड़ा प्रतिगमन गुणांक है
.
-
यह त्रुटि या अवशिष्ट है, यानी देखे गए मूल्य और मॉडल द्वारा अनुमानित मूल्य के बीच का अंतर है।
-
मॉडल में चरों की कुल संख्या है।
तो अगर हमारे पास कुल मिलाकर एक नमूना है
अवलोकनों के अनुसार, हम मैट्रिक्स रूप में एकाधिक रैखिक प्रतिगमन मॉडल का प्रस्ताव कर सकते हैं:
उपरोक्त सरणी अभिव्यक्ति को प्रत्येक सरणी के लिए एक अक्षर निर्दिष्ट करके फिर से लिखा जा सकता है:
इस प्रकार, न्यूनतम वर्ग मानदंड को लागू करके, एकाधिक रैखिक प्रतिगमन मॉडल के गुणांक का अनुमान लगाने के लिए सूत्र पर पहुंचना संभव है:
हालाँकि, इस फॉर्मूले का अनुप्रयोग बहुत श्रमसाध्य और समय लेने वाला है, इसलिए व्यवहार में कंप्यूटर सॉफ़्टवेयर (जैसे मिनिटैब या एक्सेल) का उपयोग करने की अनुशंसा की जाती है जो एक रिग्रेशन मॉडल मल्टीपल को अधिक तेज़ी से चलाने की अनुमति देता है।
एकाधिक रेखीय प्रतिगमन धारणाएँ
एकाधिक रेखीय प्रतिगमन मॉडल में, मॉडल के वैध होने के लिए निम्नलिखित शर्तों को पूरा किया जाना चाहिए:
- स्वतंत्रता : अवशेष एक दूसरे से स्वतंत्र होने चाहिए। मॉडल की स्वतंत्रता सुनिश्चित करने का एक सामान्य तरीका नमूनाकरण प्रक्रिया में यादृच्छिकता जोड़ना है।
- समरूपता : अवशेषों की भिन्नता में एकरूपता होनी चाहिए, अर्थात अवशेषों की परिवर्तनशीलता स्थिर होनी चाहिए।
- गैर-बहुसंरेखता : मॉडल में शामिल व्याख्यात्मक चर को एक-दूसरे से नहीं जोड़ा जा सकता है या, कम से कम, उनका संबंध बहुत कमजोर होना चाहिए।
- सामान्यता : अवशेषों को सामान्य रूप से वितरित किया जाना चाहिए, या दूसरे शब्दों में, उन्हें माध्य 0 के साथ सामान्य वितरण का पालन करना चाहिए।
- रैखिकता : यह माना जाता है कि प्रतिक्रिया चर और व्याख्यात्मक चर के बीच संबंध रैखिक है।
एकाधिक रैखिक प्रतिगमन मॉडल की व्याख्या करना
एकाधिक रेखीय प्रतिगमन मॉडल की व्याख्या करने के लिए, हमें निर्धारण के गुणांक (आर वर्ग) को देखना चाहिए, जो प्रतिगमन मॉडल द्वारा समझाए गए प्रतिशत को व्यक्त करता है। इस प्रकार, निर्धारण का गुणांक जितना अधिक होगा, मॉडल को अध्ययन किए गए डेटा नमूने में उतना ही अधिक समायोजित किया जाएगा।
हालाँकि, एक सांख्यिकीय मॉडल के फिट होने की अच्छाई भ्रामक हो सकती है, खासकर कई रैखिक प्रतिगमन मॉडल में। क्योंकि मॉडल में एक वेरिएबल जोड़ते समय, निर्धारण का गुणांक बढ़ जाता है, भले ही वेरिएबल महत्वपूर्ण न हो। हालाँकि, चर की संख्या को कम करने का प्रयास करके निर्धारण के गुणांक को अधिकतम करना आवश्यक है, क्योंकि मॉडल कम जटिल और व्याख्या करने में आसान है।
इस समस्या को हल करने के लिए, निर्धारण के समायोजित गुणांक (समायोजित आर वर्ग) की गणना करना आवश्यक है, जो एक सांख्यिकीय गुणांक है जो एक प्रतिगमन मॉडल के फिट की गुणवत्ता को मापता है, जो असमायोजित गुणांक के विपरीत, मॉडल में जोड़े गए प्रत्येक चर के लिए दंडित करता है। दृढ़ संकल्प का. यह मॉडल में चरों की संख्या को ध्यान में नहीं रखता है।
इस प्रकार, निर्धारण का समायोजित गुणांक हमें अलग-अलग संख्या में चर के साथ दो मॉडलों की फिट की अच्छाई की तुलना करने की अनुमति देता है। सिद्धांत रूप में, किसी को उस मॉडल को चुनना चाहिए जिसमें निर्धारण का समायोजित गुणांक अधिक हो, लेकिन यदि दो मॉडलों में बहुत समान मूल्य हैं, तो कम चर वाले मॉडल का चयन करना बेहतर है क्योंकि इसकी व्याख्या करना आसान है।
इसके विपरीत, प्रतिगमन गुणांक व्याख्यात्मक चर और प्रतिक्रिया चर के बीच संबंध को दर्शाते हैं। यदि प्रतिगमन गुणांक सकारात्मक है, तो व्याख्यात्मक चर बढ़ने पर प्रतिक्रिया चर भी बढ़ जाएगा। जबकि यदि प्रतिगमन गुणांक नकारात्मक है, तो व्याख्यात्मक चर बढ़ने पर प्रतिक्रिया चर कम हो जाएगा।
तार्किक रूप से, पिछली शर्त को पूरा करने के लिए, अन्य चर स्थिर रहना चाहिए। इसीलिए यह महत्वपूर्ण है कि मॉडल के विभिन्न व्याख्यात्मक चरों के बीच कोई बहुसंरेखता न हो। आप हमारी वेबसाइट पर संबंधित लेख खोजकर देख सकते हैं कि किसी मॉडल की बहुसंरेखता का अध्ययन कैसे किया जाता है।
एकाधिक और सरल रैखिक प्रतिगमन
अंत में, हम देखेंगे कि एक सरल रैखिक प्रतिगमन मॉडल और एक एकाधिक रैखिक प्रतिगमन मॉडल के बीच क्या अंतर हैं, क्योंकि वे दो प्रतिगमन मॉडल हैं जो व्यापक रूप से आंकड़ों में उपयोग किए जाते हैं।
सरल रैखिक प्रतिगमन एक प्रतिगमन मॉडल है जिसका उपयोग एक स्वतंत्र चर से संबंधित करने के लिए किया जाता है। तो एक सरल रैखिक प्रतिगमन मॉडल का समीकरण इस प्रकार है:
इसलिए, एकाधिक रैखिक प्रतिगमन और सरल रैखिक प्रतिगमन के बीच का अंतर व्याख्यात्मक चर की संख्या में निहित है। एक एकाधिक रेखीय प्रतिगमन मॉडल में दो या अधिक व्याख्यात्मक चर होते हैं, जबकि एक सरल रैखिक प्रतिगमन मॉडल में केवल एक व्याख्यात्मक चर होता है।
निष्कर्ष में, एकाधिक रैखिक प्रतिगमन सरल रैखिक प्रतिगमन का एक विस्तार है, क्योंकि अधिक व्याख्यात्मक चर और उनके संबंधित प्रतिगमन गुणांक आसानी से जोड़े जाते हैं। हालाँकि, प्रतिगमन गुणांक की गणना अलग-अलग तरीके से की जाती है, यह कैसे किया जाता है यह देखने के लिए यहां क्लिक करें: