प्रतिगमन समीकरण

यह आलेख बताता है कि प्रतिगमन समीकरण क्या है और इसका उपयोग किस लिए किया जाता है। इसी तरह, आप सीखेंगे कि एक प्रतिगमन समीकरण, एक हल किया गया अभ्यास और अंत में, किसी भी डेटा सेट के लिए प्रतिगमन समीकरण की गणना करने के लिए एक ऑनलाइन कैलकुलेटर कैसे ढूंढें।

प्रतिगमन समीकरण क्या है?

प्रतिगमन समीकरण वह समीकरण है जो एक डॉट प्लॉट के लिए सबसे उपयुक्त होता है, अर्थात, प्रतिगमन समीकरण डेटा के एक सेट का सबसे अच्छा सन्निकटन है।

प्रतिगमन समीकरण y=β 01 x के रूप का है, जहां β 0 समीकरण का स्थिरांक है और β 1 समीकरण का ढलान है।

y=\beta_0+\beta_1x

यदि आप समाश्रयण समीकरण को देखें, तो यह एक रेखा का समीकरण है। इसका मतलब यह है कि स्वतंत्र चर X और आश्रित चर Y के बीच का संबंध एक रैखिक संबंध के रूप में तैयार किया गया है, क्योंकि रेखा एक रैखिक संबंध का प्रतिनिधित्व करती है।

तो, प्रतिगमन समीकरण हमें डेटा सेट के स्वतंत्र चर और आश्रित चर को गणितीय रूप से जोड़ने की अनुमति देता है। यद्यपि प्रतिगमन समीकरण आम तौर पर प्रत्येक अवलोकन के मूल्य को सटीक रूप से निर्धारित करने में सक्षम नहीं है, फिर भी इसका उपयोग इसके मूल्य का अनुमान प्राप्त करने के लिए किया जाता है।

प्रतिगमन समीकरण

जैसा कि आप पिछले चार्ट में देख सकते हैं, प्रतिगमन समीकरण हमें डेटा सेट की प्रवृत्ति और स्वतंत्र चर और आश्रित चर के बीच किस प्रकार का संबंध मौजूद है, यह देखने में मदद करता है।

प्रतिगमन समीकरण की गणना कैसे करें

सरल रैखिक प्रतिगमन समीकरण के गुणांकों की गणना के सूत्र इस प्रकार हैं:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

सोना:

  • \beta_0

    प्रतिगमन समीकरण का स्थिरांक है।

  • \beta_1

    प्रतिगमन समीकरण का ढलान है.

  • x_i

    डेटा i के स्वतंत्र चर X का मान है।

  • y_i

    डेटा i के आश्रित चर Y का मान है।

  • \overline{x}

    स्वतंत्र चर के मानों का औसत है

  • \overline{y}

    आश्रित चर Y के मानों का औसत है।

प्रतिगमन समीकरण की गणना का उदाहरण

  • सांख्यिकी परीक्षा देने के बाद, पांच छात्रों से पूछा गया कि उन्होंने परीक्षा में कितने घंटे अध्ययन किया, डेटा नीचे दी गई तालिका में दिखाया गया है। अध्ययन के घंटों को प्राप्त ग्रेड से रैखिक रूप से जोड़ने के लिए एकत्र किए गए सांख्यिकीय डेटा से प्रतिगमन समीकरण की गणना करें। इसके बाद, निर्धारित करें कि 8 घंटे पढ़ाई करने वाले छात्र को कौन सा ग्रेड मिलेगा।

नमूना डेटा के लिए प्रतिगमन समीकरण खोजने के लिए, हमें समीकरण के गुणांक b 0 और b 1 निर्धारित करने की आवश्यकता है और, ऐसा करने के लिए, हमें उपरोक्त अनुभाग में देखे गए सूत्रों का उपयोग करने की आवश्यकता है।

हालाँकि, रेखीय प्रतिगमन समीकरण के सूत्रों को लागू करने के लिए, हमें पहले स्वतंत्र चर के माध्य और आश्रित चर के माध्य की गणना करनी होगी:

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

अब जब हम चरों के माध्य जानते हैं, तो हम मॉडल के गुणांक β 1 की गणना उसके संगत सूत्र का उपयोग करके करते हैं:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] \beta_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]\beta_1=0,4412\end{array}

अंत में, हम संबंधित सूत्र का उपयोग करके मॉडल के गुणांक β 0 की गणना करते हैं:

\begin{array}{l}\beta_0=\overline{y}-\beta_1\overline{x}\\[3ex]\beta_0=6-0,4412\cdot 9 \\[3ex]\beta_0=2,0294\end{array}

संक्षेप में, समस्या की रैखिक प्रतिगमन रेखा का समीकरण इस प्रकार है:

y=2,0294+0,4412x

नीचे आप सरल रैखिक प्रतिगमन मॉडल समीकरण के साथ नमूना डेटा का ग्राफिकल प्रतिनिधित्व देख सकते हैं:

रैखिक प्रतिगमन रेखा उदाहरण

एक बार जब हम प्रतिगमन समीकरण की गणना कर लेते हैं, तो यह अनुमान लगाने के लिए कि 8 घंटे अध्ययन करने वाले छात्र को कौन सा ग्रेड मिलेगा, बस इस मान को परिणामी प्रतिगमन समीकरण में प्रतिस्थापित करें:

y=2,0294+0,4412\cdot 8=5,56

इस प्रकार, किए गए रैखिक प्रतिगमन मॉडल के अनुसार, यदि कोई छात्र आठ घंटे अध्ययन करता है, तो उसे परीक्षा में 5.56 अंक प्राप्त होंगे।

प्रतिगमन समीकरण कैलकुलेटर

अपने प्रतिगमन समीकरण की गणना करने के लिए नीचे दिए गए कैलकुलेटर में एक नमूना डेटा प्लग करें। आपको डेटा जोड़े को अलग करने की आवश्यकता है, ताकि पहले बॉक्स में केवल स्वतंत्र चर X के मान हों और दूसरे बॉक्स में केवल आश्रित चर Y के मान हों।

डेटा को एक स्थान से अलग किया जाना चाहिए और दशमलव विभाजक के रूप में अवधि का उपयोग करके दर्ज किया जाना चाहिए।

  • स्वतंत्र चर

  • आश्रित चर Y:

एकाधिक रेखीय प्रतिगमन समीकरण

हमने अभी देखा कि सरल रेखीय प्रतिगमन समीकरण क्या है, हालाँकि, प्रतिगमन मॉडल एक बहु रेखीय प्रतिगमन मॉडल भी हो सकता है, जिसमें दो या दो से अधिक स्वतंत्र चर शामिल होते हैं। इस प्रकार, एकाधिक रैखिक प्रतिगमन कई व्याख्यात्मक चर को प्रतिक्रिया चर से रैखिक रूप से जोड़ना संभव बनाता है।

एकाधिक रेखीय प्रतिगमन मॉडल के लिए समीकरण है:

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

सोना:

  • y

    आश्रित चर है.

  • x_i

    स्वतंत्र चर है i.

  • \beta_0

    बहुरेखीय प्रतिगमन समीकरण का स्थिरांक है।

  • \beta_i

    चर से जुड़ा प्रतिगमन गुणांक है

    x_i

    .

  • \bm{\varepsilon}

    त्रुटि या अवशिष्ट है, यानी देखे गए मूल्य और मॉडल द्वारा अनुमानित मूल्य के बीच का अंतर है।

  • m

    मॉडल में चरों की कुल संख्या है।

तो अगर हमारे पास कुल मिलाकर एक नमूना है

n

अवलोकनों के अनुसार, हम एकाधिक रैखिक प्रतिगमन मॉडल को मैट्रिक्स रूप में प्रस्तुत कर सकते हैं:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

उपरोक्त मैट्रिक्स अभिव्यक्ति को प्रत्येक मैट्रिक्स को एक अक्षर निर्दिष्ट करके फिर से लिखा जा सकता है:

Y=X\beta+\varepsilon

इस प्रकार, न्यूनतम वर्ग मानदंड को लागू करके, हम एकाधिक रैखिक प्रतिगमन समीकरण के गुणांक का अनुमान लगाने के सूत्र पर पहुंच सकते हैं:

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

हालाँकि, इस सूत्र का अनुप्रयोग बहुत श्रमसाध्य और समय लेने वाला है, यही कारण है कि व्यवहार में कंप्यूटर सॉफ़्टवेयर (जैसे मिनीटैब या एक्सेल) का उपयोग करने की अनुशंसा की जाती है जो कई प्रतिगमन मॉडल को अधिक तेज़ी से बनाने की अनुमति देता है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *