एकाधिक रेखीय प्रतिगमन का परिचय


जब हम एकल भविष्यवक्ता चर और प्रतिक्रिया चर के बीच संबंध को समझना चाहते हैं, तो हम अक्सर सरल रैखिक प्रतिगमन का उपयोग करते हैं।

हालाँकि, यदि हम एकाधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को समझना चाहते हैं, तो हम एकाधिक रैखिक प्रतिगमन का उपयोग कर सकते हैं।

यदि हमारे पास पी भविष्यवक्ता चर हैं, तो एक एकाधिक रैखिक प्रतिगमन मॉडल फॉर्म लेता है:

वाई = β 0 + β 1 एक्स 1 + β 2 एक्स 2 + … + β पी

सोना:

  • Y : प्रतिक्रिया चर
  • एक्स जे : जे वें पूर्वानुमानित चर
  • β जे : एक्स जे में एक इकाई की वृद्धि का वाई पर औसत प्रभाव, अन्य सभी भविष्यवक्ताओं को स्थिर रखता है
  • ε : त्रुटि पद

β 0 , β 1 , B 2 , …, β p का मान न्यूनतम वर्ग विधि का उपयोग करके चुना जाता है, जो अवशेषों (RSS) के वर्गों के योग को कम करता है:

आरएसएस = Σ(y i – ŷ i ) 2

सोना:

  • Σ : एक ग्रीक प्रतीक जिसका अर्थ है योग
  • y i : iवें अवलोकन के लिए वास्तविक प्रतिक्रिया मान
  • ŷ i : एकाधिक रेखीय प्रतिगमन मॉडल के आधार पर अनुमानित प्रतिक्रिया मूल्य

मैट्रिक्स बीजगणित से जुड़े इन गुणांक अनुमानों को खोजने के लिए विधि का उपयोग किया जाता है और हम यहां विवरण में नहीं जाएंगे। सौभाग्य से, कोई भी सांख्यिकीय सॉफ़्टवेयर आपके लिए इन गुणांकों की गणना कर सकता है।

एकाधिक रैखिक प्रतिगमन आउटपुट की व्याख्या कैसे करें

मान लीजिए कि हम भविष्यवक्ता चर , अध्ययन किए गए घंटों और ली गई प्रारंभिक परीक्षाओं के साथ-साथ एक उत्तर चर परीक्षा स्कोर का उपयोग करके एक एकाधिक रैखिक प्रतिगमन मॉडल फिट करते हैं।

निम्नलिखित स्क्रीनशॉट दिखाता है कि इस मॉडल के लिए एकाधिक रैखिक प्रतिगमन परिणाम कैसा दिख सकता है:

ध्यान दें: नीचे दिया गया स्क्रीनशॉट एक्सेल के लिए मल्टीपल लीनियर रिग्रेशन आउटपुट दिखाता है, लेकिन आउटपुट में दिखाए गए नंबर उस रिग्रेशन आउटपुट के विशिष्ट हैं जिन्हें आप किसी भी सांख्यिकीय सॉफ़्टवेयर का उपयोग करके देखेंगे।

एकाधिक रैखिक प्रतिगमन परिणामों की व्याख्या करना

मॉडल परिणामों से, गुणांक हमें अनुमानित एकाधिक रैखिक प्रतिगमन मॉडल बनाने की अनुमति देते हैं:

परीक्षा स्कोर = 67.67 + 5.56*(घंटे) – 0.60*(प्रारंभिक परीक्षा)

गुणांकों की व्याख्या करने का तरीका इस प्रकार है:

  • अध्ययन किए गए घंटों में प्रत्येक अतिरिक्त एक-इकाई वृद्धि परीक्षा स्कोर में 5.56 अंकों की औसत वृद्धि के साथ जुड़ी हुई है, यह मानते हुए कि अभ्यास परीक्षाएं स्थिर रहती हैं।
  • ली गई प्रारंभिक परीक्षाओं में प्रत्येक अतिरिक्त एक-यूनिट वृद्धि परीक्षा स्कोर में औसत 0.60 अंक की कमी के साथ जुड़ी हुई है, यह मानते हुए कि अध्ययन किए गए घंटों की संख्या स्थिर रहती है।

हम इस मॉडल का उपयोग यह निर्धारित करने के लिए भी कर सकते हैं कि एक छात्र को अध्ययन किए गए घंटों की कुल संख्या और ली गई तैयारी परीक्षाओं के आधार पर अपेक्षित परीक्षा ग्रेड मिलेगा। उदाहरण के लिए, एक छात्र जो 4 घंटे पढ़ाई करता है और 1 प्रारंभिक परीक्षा देता है, उसे 89.31 का परीक्षा स्कोर प्राप्त करना चाहिए:

परीक्षा स्कोर = 67.67 + 5.56*(4) -0.60*(1) = 89.31

यहां बताया गया है कि शेष मॉडल परिणामों की व्याख्या कैसे करें:

  • आर-स्क्वायर: इसे निर्धारण गुणांक कहा जाता है। यह प्रतिक्रिया चर के विचरण का अनुपात है जिसे व्याख्यात्मक चर द्वारा समझाया जा सकता है। इस उदाहरण में, परीक्षा के अंकों में 73.4% भिन्नता को अध्ययन किए गए घंटों की संख्या और ली गई तैयारी परीक्षाओं की संख्या द्वारा समझाया गया है।
  • मानक त्रुटि: यह प्रेक्षित मानों और प्रतिगमन रेखा के बीच की औसत दूरी है। इस उदाहरण में, देखे गए मान प्रतिगमन रेखा से औसतन 5,366 इकाइयों तक विचलित होते हैं।
  • एफ: यह प्रतिगमन मॉडल के लिए समग्र एफ आँकड़ा है, जिसकी गणना प्रतिगमन एमएस/अवशिष्ट एमएस के रूप में की जाती है।
  • एफ का अर्थ: यह समग्र एफ सांख्यिकी से जुड़ा पी-मूल्य है। यह हमें बताता है कि समग्र रूप से प्रतिगमन मॉडल सांख्यिकीय रूप से महत्वपूर्ण है या नहीं। दूसरे शब्दों में, यह हमें बताता है कि क्या दो व्याख्यात्मक चर संयुक्त रूप से प्रतिक्रिया चर के साथ सांख्यिकीय रूप से महत्वपूर्ण संबंध रखते हैं। इस मामले में, पी-वैल्यू 0.05 से कम है, जो दर्शाता है कि व्याख्यात्मक चर, अध्ययन किए गए घंटे और ली गई तैयारी परीक्षाओं का संयुक्त रूप से परीक्षा परिणाम के साथ सांख्यिकीय रूप से महत्वपूर्ण संबंध है।
  • गुणांक के पी मान. व्यक्तिगत पी-मान हमें बताते हैं कि प्रत्येक व्याख्यात्मक चर सांख्यिकीय रूप से महत्वपूर्ण है या नहीं। हम देख सकते हैं कि अध्ययन किए गए घंटे सांख्यिकीय रूप से महत्वपूर्ण हैं (पी = 0.00) जबकि ली गई प्रारंभिक परीक्षा (पी = 0.52) α = 0.05 पर सांख्यिकीय रूप से महत्वपूर्ण नहीं है। चूंकि पिछली प्रारंभिक परीक्षाएं सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं, इसलिए हम उन्हें मॉडल से हटाने का निर्णय ले सकते हैं।

एकाधिक रैखिक प्रतिगमन मॉडल के फिट का मूल्यांकन कैसे करें

दो संख्याओं का उपयोग आमतौर पर यह मूल्यांकन करने के लिए किया जाता है कि एक एकाधिक रैखिक प्रतिगमन मॉडल एक डेटा सेट को कितनी अच्छी तरह “फिट” करता है:

1. आर-वर्ग: यह प्रतिक्रिया चर में भिन्नता का अनुपात है जिसे भविष्यवक्ता चर द्वारा समझाया जा सकता है।

आर-वर्ग मान 0 से 1 तक हो सकता है। 0 का मान इंगित करता है कि प्रतिक्रिया चर को भविष्यवक्ता चर द्वारा बिल्कुल भी समझाया नहीं जा सकता है। 1 का मान इंगित करता है कि प्रतिक्रिया चर को भविष्यवक्ता चर द्वारा त्रुटि के बिना पूरी तरह से समझाया जा सकता है।

किसी मॉडल का R वर्ग जितना अधिक होगा, मॉडल डेटा को उतना ही बेहतर ढंग से फिट करने में सक्षम होगा।

2. मानक त्रुटि: यह प्रेक्षित मानों और प्रतिगमन रेखा के बीच की औसत दूरी है। मानक त्रुटि जितनी छोटी होगी, मॉडल डेटा को फिट करने में उतना ही बेहतर सक्षम होगा।

यदि हम प्रतिगमन मॉडल का उपयोग करके भविष्यवाणियां करना चाहते हैं, तो प्रतिगमन की मानक त्रुटि आर-वर्ग की तुलना में जानने के लिए अधिक उपयोगी मीट्रिक हो सकती है, क्योंकि यह हमें यह अंदाजा देती है कि इकाइयों के संदर्भ में हमारी भविष्यवाणियां कितनी सटीक हैं।

मॉडल फिट का मूल्यांकन करने के लिए आर-स्क्वायर बनाम मानक त्रुटि का उपयोग करने के पेशेवरों और विपक्षों की पूरी व्याख्या के लिए, निम्नलिखित लेख देखें:

एकाधिक रेखीय प्रतिगमन धारणाएँ

एकाधिक रैखिक प्रतिगमन डेटा के बारे में चार प्रमुख धारणाएँ बनाता है:

1. रैखिक संबंध: स्वतंत्र चर, x और आश्रित चर, y के बीच एक रैखिक संबंध होता है।

2. स्वतंत्रता: अवशिष्ट स्वतंत्र होते हैं। विशेष रूप से, समय श्रृंखला डेटा में लगातार अवशेषों के बीच कोई संबंध नहीं है।

3. समरूपता: x के प्रत्येक स्तर पर अवशेषों में निरंतर भिन्नता होती है।

4. सामान्यता: मॉडल अवशेष सामान्य रूप से वितरित होते हैं।

इन परिकल्पनाओं का परीक्षण कैसे करें, इसकी पूरी व्याख्या के लिए यह लेख देखें।

सॉफ़्टवेयर का उपयोग करके एकाधिक रैखिक प्रतिगमन

निम्नलिखित ट्यूटोरियल विभिन्न सांख्यिकीय सॉफ़्टवेयर का उपयोग करके एकाधिक रैखिक प्रतिगमन कैसे करें, इस पर चरण-दर-चरण उदाहरण प्रदान करते हैं:

आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
पायथन में मल्टीपल लीनियर रिग्रेशन कैसे करें
एक्सेल में मल्टीपल लीनियर रिग्रेशन कैसे करें
एसपीएसएस में मल्टीपल लीनियर रिग्रेशन कैसे करें
स्टाटा में मल्टीपल लीनियर रिग्रेशन कैसे करें
Google शीट्स में रैखिक प्रतिगमन कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *