एकाधिक रेखीय प्रतिगमन

यह आलेख बताता है कि आंकड़ों में एकाधिक रैखिक प्रतिगमन क्या है। इसके अतिरिक्त, आप सीखेंगे कि एकाधिक रैखिक प्रतिगमन मॉडल कैसे बनाया जाता है और इसकी व्याख्या कैसे की जाती है।

एकाधिक रैखिक प्रतिगमन क्या है?

मल्टीपल लीनियर रिग्रेशन एक रिग्रेशन मॉडल है जिसमें दो या दो से अधिक स्वतंत्र चर शामिल होते हैं। दूसरे शब्दों में, मल्टीपल लीनियर रिग्रेशन एक सांख्यिकीय मॉडल है जो कई व्याख्यात्मक चर को प्रतिक्रिया चर से रैखिक रूप से जोड़ने की अनुमति देता है।

इसलिए, एक बहु रेखीय प्रतिगमन मॉडल का उपयोग एक समीकरण खोजने के लिए किया जाता है जो दो या दो से अधिक स्वतंत्र चर को एक आश्रित चर से संबंधित करता है। इस प्रकार, प्रत्येक स्वतंत्र चर के मान को प्रतिस्थापित करके, आश्रित चर के मान का एक अनुमान प्राप्त किया जाता है।

उदाहरण के लिए, समीकरण y=3+6x 1 -4x 2 +7x 3 एक बहु रेखीय प्रतिगमन मॉडल है क्योंकि यह गणितीय रूप से तीन स्वतंत्र चर (x 1 , x 2 , x 3 ) को एक आश्रित चर (y) रैखिक मान पथ से जोड़ता है। .

एकाधिक रेखीय प्रतिगमन सूत्र

एकाधिक रैखिक प्रतिगमन मॉडल के लिए समीकरण y=β 01 x 12 x 2 +…+β m x m +ε है।

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

सोना:

  • y

    आश्रित चर है.

  • x_i

    स्वतंत्र चर है i.

  • \beta_0

    बहुरेखीय प्रतिगमन समीकरण का स्थिरांक है।

  • \beta_i

    चर से जुड़ा प्रतिगमन गुणांक है

    x_i

    .

  • \bm{\varepsilon}

    यह त्रुटि या अवशिष्ट है, यानी देखे गए मूल्य और मॉडल द्वारा अनुमानित मूल्य के बीच का अंतर है।

  • m

    मॉडल में चरों की कुल संख्या है।

तो अगर हमारे पास कुल मिलाकर एक नमूना है

n

अवलोकनों के अनुसार, हम मैट्रिक्स रूप में एकाधिक रैखिक प्रतिगमन मॉडल का प्रस्ताव कर सकते हैं:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

उपरोक्त सरणी अभिव्यक्ति को प्रत्येक सरणी के लिए एक अक्षर निर्दिष्ट करके फिर से लिखा जा सकता है:

Y=X\beta+\varepsilon

इस प्रकार, न्यूनतम वर्ग मानदंड को लागू करके, एकाधिक रैखिक प्रतिगमन मॉडल के गुणांक का अनुमान लगाने के लिए सूत्र पर पहुंचना संभव है:

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

हालाँकि, इस फॉर्मूले का अनुप्रयोग बहुत श्रमसाध्य और समय लेने वाला है, इसलिए व्यवहार में कंप्यूटर सॉफ़्टवेयर (जैसे मिनिटैब या एक्सेल) का उपयोग करने की अनुशंसा की जाती है जो एक रिग्रेशन मॉडल मल्टीपल को अधिक तेज़ी से चलाने की अनुमति देता है।

एकाधिक रेखीय प्रतिगमन धारणाएँ

एकाधिक रेखीय प्रतिगमन मॉडल में, मॉडल के वैध होने के लिए निम्नलिखित शर्तों को पूरा किया जाना चाहिए:

  • स्वतंत्रता : अवशेष एक दूसरे से स्वतंत्र होने चाहिए। मॉडल की स्वतंत्रता सुनिश्चित करने का एक सामान्य तरीका नमूनाकरण प्रक्रिया में यादृच्छिकता जोड़ना है।
  • समरूपता : अवशेषों की भिन्नता में एकरूपता होनी चाहिए, अर्थात अवशेषों की परिवर्तनशीलता स्थिर होनी चाहिए।
  • गैर-बहुसंरेखता : मॉडल में शामिल व्याख्यात्मक चर को एक-दूसरे से नहीं जोड़ा जा सकता है या, कम से कम, उनका संबंध बहुत कमजोर होना चाहिए।
  • सामान्यता : अवशेषों को सामान्य रूप से वितरित किया जाना चाहिए, या दूसरे शब्दों में, उन्हें माध्य 0 के साथ सामान्य वितरण का पालन करना चाहिए।
  • रैखिकता : यह माना जाता है कि प्रतिक्रिया चर और व्याख्यात्मक चर के बीच संबंध रैखिक है।

एकाधिक रैखिक प्रतिगमन मॉडल की व्याख्या करना

एकाधिक रेखीय प्रतिगमन मॉडल की व्याख्या करने के लिए, हमें निर्धारण के गुणांक (आर वर्ग) को देखना चाहिए, जो प्रतिगमन मॉडल द्वारा समझाए गए प्रतिशत को व्यक्त करता है। इस प्रकार, निर्धारण का गुणांक जितना अधिक होगा, मॉडल को अध्ययन किए गए डेटा नमूने में उतना ही अधिक समायोजित किया जाएगा।

हालाँकि, एक सांख्यिकीय मॉडल के फिट होने की अच्छाई भ्रामक हो सकती है, खासकर कई रैखिक प्रतिगमन मॉडल में। क्योंकि मॉडल में एक वेरिएबल जोड़ते समय, निर्धारण का गुणांक बढ़ जाता है, भले ही वेरिएबल महत्वपूर्ण न हो। हालाँकि, चर की संख्या को कम करने का प्रयास करके निर्धारण के गुणांक को अधिकतम करना आवश्यक है, क्योंकि मॉडल कम जटिल और व्याख्या करने में आसान है।

इस समस्या को हल करने के लिए, निर्धारण के समायोजित गुणांक (समायोजित आर वर्ग) की गणना करना आवश्यक है, जो एक सांख्यिकीय गुणांक है जो एक प्रतिगमन मॉडल के फिट की गुणवत्ता को मापता है, जो असमायोजित गुणांक के विपरीत, मॉडल में जोड़े गए प्रत्येक चर के लिए दंडित करता है। दृढ़ संकल्प का. यह मॉडल में चरों की संख्या को ध्यान में नहीं रखता है।

इस प्रकार, निर्धारण का समायोजित गुणांक हमें अलग-अलग संख्या में चर के साथ दो मॉडलों की फिट की अच्छाई की तुलना करने की अनुमति देता है। सिद्धांत रूप में, किसी को उस मॉडल को चुनना चाहिए जिसमें निर्धारण का समायोजित गुणांक अधिक हो, लेकिन यदि दो मॉडलों में बहुत समान मूल्य हैं, तो कम चर वाले मॉडल का चयन करना बेहतर है क्योंकि इसकी व्याख्या करना आसान है।

इसके विपरीत, प्रतिगमन गुणांक व्याख्यात्मक चर और प्रतिक्रिया चर के बीच संबंध को दर्शाते हैं। यदि प्रतिगमन गुणांक सकारात्मक है, तो व्याख्यात्मक चर बढ़ने पर प्रतिक्रिया चर भी बढ़ जाएगा। जबकि यदि प्रतिगमन गुणांक नकारात्मक है, तो व्याख्यात्मक चर बढ़ने पर प्रतिक्रिया चर कम हो जाएगा।

तार्किक रूप से, पिछली शर्त को पूरा करने के लिए, अन्य चर स्थिर रहना चाहिए। इसीलिए यह महत्वपूर्ण है कि मॉडल के विभिन्न व्याख्यात्मक चरों के बीच कोई बहुसंरेखता न हो। आप हमारी वेबसाइट पर संबंधित लेख खोजकर देख सकते हैं कि किसी मॉडल की बहुसंरेखता का अध्ययन कैसे किया जाता है।

एकाधिक और सरल रैखिक प्रतिगमन

अंत में, हम देखेंगे कि एक सरल रैखिक प्रतिगमन मॉडल और एक एकाधिक रैखिक प्रतिगमन मॉडल के बीच क्या अंतर हैं, क्योंकि वे दो प्रतिगमन मॉडल हैं जो व्यापक रूप से आंकड़ों में उपयोग किए जाते हैं।

सरल रैखिक प्रतिगमन एक प्रतिगमन मॉडल है जिसका उपयोग एक स्वतंत्र चर से संबंधित करने के लिए किया जाता है। तो एक सरल रैखिक प्रतिगमन मॉडल का समीकरण इस प्रकार है:

y=\beta_0+\beta_1x_1+\varepsilon

इसलिए, एकाधिक रैखिक प्रतिगमन और सरल रैखिक प्रतिगमन के बीच का अंतर व्याख्यात्मक चर की संख्या में निहित है। एक एकाधिक रेखीय प्रतिगमन मॉडल में दो या अधिक व्याख्यात्मक चर होते हैं, जबकि एक सरल रैखिक प्रतिगमन मॉडल में केवल एक व्याख्यात्मक चर होता है।

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

निष्कर्ष में, एकाधिक रैखिक प्रतिगमन सरल रैखिक प्रतिगमन का एक विस्तार है, क्योंकि अधिक व्याख्यात्मक चर और उनके संबंधित प्रतिगमन गुणांक आसानी से जोड़े जाते हैं। हालाँकि, प्रतिगमन गुणांक की गणना अलग-अलग तरीके से की जाती है, यह कैसे किया जाता है यह देखने के लिए यहां क्लिक करें:

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *