प्रतिगमन तालिका को कैसे पढ़ें और व्याख्या करें


आंकड़ों में, प्रतिगमन एक ऐसी तकनीक है जिसका उपयोग भविष्यवक्ता चर और प्रतिक्रिया चर के बीच संबंधों का विश्लेषण करने के लिए किया जा सकता है।

जब आप प्रतिगमन विश्लेषण करने के लिए सॉफ़्टवेयर (जैसे आर, एसएएस, एसपीएसएस, आदि) का उपयोग करते हैं, तो आपको आउटपुट के रूप में प्रतिगमन परिणामों का सारांश देने वाली एक प्रतिगमन तालिका प्राप्त होगी। यह जानना महत्वपूर्ण है कि इस तालिका को कैसे पढ़ा जाए ताकि आप प्रतिगमन विश्लेषण के परिणामों को समझ सकें।

यह ट्यूटोरियल प्रतिगमन विश्लेषण का एक उदाहरण दिखाता है और प्रतिगमन तालिका के परिणाम को पढ़ने और व्याख्या करने के तरीके का विस्तृत विवरण प्रदान करता है।

प्रतिगमन का एक उदाहरण

मान लीजिए कि हमारे पास निम्नलिखित डेटा सेट है जो अध्ययन किए गए घंटों की कुल संख्या, ली गई तैयारी परीक्षाओं की कुल संख्या और 12 अलग-अलग छात्रों के लिए अंतिम परीक्षा ग्रेड दिखाता है:

एक छात्र द्वारा प्राप्त अंतिम परीक्षा ग्रेड के साथ अध्ययन किए गए घंटों और ली गई तैयारी परीक्षाओं के बीच संबंध का विश्लेषण करने के लिए, हम अध्ययन किए गए घंटों और तैयारी परीक्षाओं को भविष्यवक्ता चर के रूप में और परीक्षा के तहत अंतिम ग्रेड को प्रतिक्रिया चर के रूप में उपयोग करके एक बहु रेखीय प्रतिगमन करते हैं।

हमें निम्नलिखित परिणाम प्राप्त होता है:

मॉडल फिट की जांच करना

पहला खंड कई अलग-अलग संख्याएँ दिखाता है जो प्रतिगमन मॉडल फिट को मापते हैं, अर्थात, प्रतिगमन मॉडल डेटा सेट को कितनी अच्छी तरह “फिट” करने में सक्षम है।

इस अनुभाग में प्रत्येक संख्या की व्याख्या कैसे करें:

कई रु

यह सहसंबंध गुणांक है. यह भविष्यवक्ता चर और प्रतिक्रिया चर के बीच रैखिक संबंध की ताकत को मापता है। 1 का R गुणक एक पूर्ण रैखिक संबंध को इंगित करता है जबकि 0 का R गुणक कोई रैखिक संबंध नहीं दर्शाता है। एकाधिक R, R वर्ग का वर्गमूल है (नीचे देखें)।

इस उदाहरण में, एकाधिक आर 0.72855 है , जो अध्ययन के घंटों और भविष्यवक्ताओं की प्रारंभिक परीक्षाओं और प्रतिक्रिया चर के अंतिम परीक्षा ग्रेड के बीच एक काफी मजबूत रैखिक संबंध को इंगित करता है।

आर चुकता

इसे अक्सर r2 के रूप में लिखा जाता है और इसे निर्धारण के गुणांक के रूप में भी जाना जाता है। यह प्रतिक्रिया चर में भिन्नता का अनुपात है जिसे भविष्यवक्ता चर द्वारा समझाया जा सकता है।

आर-वर्ग मान 0 से 1 तक हो सकता है। 0 का मान इंगित करता है कि प्रतिक्रिया चर को भविष्यवक्ता चर द्वारा बिल्कुल भी समझाया नहीं जा सकता है। 1 का मान इंगित करता है कि प्रतिक्रिया चर को भविष्यवक्ता चर द्वारा त्रुटि के बिना पूरी तरह से समझाया जा सकता है।

इस उदाहरण में, आर-वर्ग 0.5307 है , जो इंगित करता है कि अंतिम परीक्षा के अंकों में 53.07% अंतर को अध्ययन किए गए घंटों की संख्या और पिछले अभ्यास परीक्षाओं की संख्या से समझाया जा सकता है।

संबंधित: एक अच्छा आर-वर्ग मान क्या है?

समायोजित आर-वर्ग

यह आर-स्क्वायर का एक संशोधित संस्करण है जिसे मॉडल में भविष्यवक्ताओं की संख्या के आधार पर समायोजित किया गया है। यह सदैव R वर्ग से कम होता है। समायोजित आर-वर्ग विभिन्न प्रतिगमन मॉडल के फिट की एक दूसरे से तुलना करने के लिए उपयोगी हो सकता है।

इस उदाहरण में, समायोजित आर-वर्ग 0.4265 है।

प्रतिगमन की मानक त्रुटि

प्रतिगमन की मानक त्रुटि प्रेक्षित मानों और प्रतिगमन रेखा के बीच की औसत दूरी है। इस उदाहरण में, देखे गए मान प्रतिगमन रेखा से औसतन 7.3267 इकाइयों तक विचलित होते हैं।

संबंधित: प्रतिगमन की मानक त्रुटि को समझना

टिप्पणियाँ

यह केवल हमारे डेटासेट में अवलोकनों की संख्या है। इस उदाहरण में, प्रेक्षणों की कुल संख्या 12 है

प्रतिगमन मॉडल के समग्र महत्व का परीक्षण करना

निम्नलिखित अनुभाग स्वतंत्रता की डिग्री, वर्गों का योग, माध्य वर्ग, एफ आँकड़ा और प्रतिगमन मॉडल के समग्र महत्व को दर्शाता है।

इस अनुभाग में प्रत्येक संख्या की व्याख्या कैसे करें:

स्वतंत्रता की प्रतिगमन डिग्री

यह संख्या इसके बराबर है: प्रतिगमन गुणांक की संख्या – 1. इस उदाहरण में, हमारे पास एक मूल शब्द और दो भविष्यवक्ता चर हैं, इसलिए हमारे पास कुल तीन प्रतिगमन गुणांक हैं, जिसका अर्थ है कि प्रतिगमन की स्वतंत्रता की डिग्री 3 – 1 है = 2 .

स्वतंत्रता की कुल डिग्री

यह संख्या इसके बराबर है: अवलोकनों की संख्या – 1. इस उदाहरण में, हमारे पास 12 अवलोकन हैं, इसलिए स्वतंत्रता की डिग्री की कुल संख्या 12 – 1 = 11 है।

स्वतंत्रता की अवशिष्ट डिग्री

यह संख्या इसके बराबर है: कुल डीएफ – प्रतिगमन डीएफ। इस उदाहरण में, स्वतंत्रता की अवशिष्ट कोटियाँ 11 – 2 = 9 हैं।

माध्य वर्ग

प्रतिगमन माध्य वर्गों की गणना एसएस प्रतिगमन/डीएफ प्रतिगमन द्वारा की जाती है। इस उदाहरण में, प्रतिगमन एमएस = 546.53308/2 = 273.2665

अवशिष्ट माध्य वर्गों की गणना अवशिष्ट एसएस/अवशिष्ट डीएफ द्वारा की जाती है। इस उदाहरण में, अवशिष्ट एमएस = 483.1335 / 9 = 53.68151

एफ आँकड़ा

एफ सांख्यिकी की गणना एमएस प्रतिगमन/एमएस अवशिष्ट के रूप में की जाती है। यह आँकड़ा इंगित करता है कि क्या प्रतिगमन मॉडल उस मॉडल की तुलना में डेटा के लिए बेहतर फिट प्रदान करता है जिसमें कोई स्वतंत्र चर नहीं है।

मूलतः, यह परीक्षण करता है कि समग्र रूप से प्रतिगमन मॉडल उपयोगी है या नहीं। आम तौर पर, यदि मॉडल में कोई भी भविष्यवक्ता चर सांख्यिकीय रूप से महत्वपूर्ण नहीं है, तो समग्र एफ आँकड़ा भी सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

इस उदाहरण में, एफ आँकड़ा 273.2665 / 53.68151 = 5.09 है

एफ का महत्व (पी मान)

तालिका में अंतिम मान एफ आँकड़े से जुड़ा पी-मान है। यह देखने के लिए कि क्या समग्र प्रतिगमन मॉडल महत्वपूर्ण है, आप पी-मान की तुलना महत्व स्तर से कर सकते हैं; सामान्य विकल्प .01, .05 और .10 हैं।

यदि पी-मान महत्व स्तर से नीचे है, तो यह निष्कर्ष निकालने के लिए पर्याप्त सबूत हैं कि प्रतिगमन मॉडल भविष्यवक्ता चर के बिना मॉडल की तुलना में डेटा को बेहतर ढंग से फिट करता है। यह परिणाम सकारात्मक है क्योंकि इसका मतलब है कि मॉडल के भविष्यवक्ता चर वास्तव में मॉडल की फिट में सुधार करते हैं।

इस उदाहरण में, पी-मान 0.033 है , जो 0.05 के सामान्य महत्व स्तर से नीचे है। यह इंगित करता है कि समग्र रूप से प्रतिगमन मॉडल सांख्यिकीय रूप से महत्वपूर्ण है, अर्थात, मॉडल भविष्यवक्ता चर के बिना मॉडल की तुलना में डेटा को बेहतर ढंग से फिट करता है।

प्रतिगमन मॉडल के समग्र महत्व का परीक्षण करना

अंतिम खंड प्रतिगमन मॉडल में प्रत्येक पद के लिए गुणांक अनुमान, अनुमान की मानक त्रुटि, टी-सांख्यिकी, पी-मान और आत्मविश्वास अंतराल प्रस्तुत करता है।

इस अनुभाग में प्रत्येक संख्या की व्याख्या कैसे करें:

गुणांकों

गुणांक हमें अनुमानित प्रतिगमन समीकरण लिखने के लिए आवश्यक संख्याएँ देते हैं:

y टोपी = b 0 + b 1 x 1 + b 2 x 2

इस उदाहरण में, अनुमानित प्रतिगमन समीकरण है:

अंतिम परीक्षा स्कोर = 66.99 + 1.299 (अध्ययन के घंटे) + 1.117 (प्रारंभिक परीक्षा)

प्रत्येक व्यक्तिगत गुणांक की व्याख्या किसी दिए गए भविष्यवक्ता चर में प्रत्येक एक-इकाई वृद्धि के लिए प्रतिक्रिया चर में औसत वृद्धि के रूप में की जाती है, यह मानते हुए कि अन्य सभी भविष्यवक्ता चर स्थिर रहते हैं। उदाहरण के लिए, अध्ययन किए गए प्रत्येक अतिरिक्त घंटे के लिए, अंतिम परीक्षा स्कोर में अपेक्षित औसत वृद्धि 1,299 अंक है, यह मानते हुए कि ली गई तैयारी परीक्षाओं की संख्या स्थिर रहती है।

इंटरसेप्ट की व्याख्या उस छात्र के लिए अंतिम परीक्षा में अपेक्षित औसत ग्रेड के रूप में की जाती है जो शून्य घंटे तक पढ़ाई करता है और कोई प्रारंभिक परीक्षा नहीं देता है। इस उदाहरण में, एक छात्र से 66.99 अंक प्राप्त करने की अपेक्षा की जाएगी यदि वह शून्य घंटे तक अध्ययन करता है और कोई तैयारी परीक्षा नहीं देता है। प्रतिगमन परिणाम के अवरोधन की व्याख्या करते समय सावधान रहें, क्योंकि ऐसा करने का हमेशा कोई मतलब नहीं होता है।

उदाहरण के लिए, कुछ मामलों में अवरोधन एक नकारात्मक संख्या बन सकता है, जिसकी अक्सर कोई स्पष्ट व्याख्या नहीं होती है। इसका मतलब यह नहीं है कि मॉडल गलत है, इसका मतलब सिर्फ यह है कि अवरोधन का कोई मतलब नहीं निकाला जाना चाहिए।

मानक त्रुटि, टी आँकड़े और पी मान

मानक त्रुटि प्रत्येक चर के लिए गुणांक अनुमान के आसपास अनिश्चितता का एक माप है।

टी-स्टेट केवल मानक त्रुटि से विभाजित गुणांक है। उदाहरण के लिए, अध्ययन घंटों के लिए टी-स्टेट 1.299 / 0.417 = 3.117 है।

अगला कॉलम टी-स्टेट से जुड़ा पी-वैल्यू दिखाता है। यह संख्या हमें बताती है कि मॉडल में दिया गया प्रतिक्रिया चर महत्वपूर्ण है या नहीं। इस उदाहरण में, हम देखते हैं कि अध्ययन के घंटों के लिए पी-मान 0.012 है और तैयारी परीक्षाओं के लिए पी-मान 0.304 है। यह इंगित करता है कि अभ्यास परीक्षाओं के विपरीत, अध्ययन के घंटे अंतिम परीक्षा ग्रेड का एक महत्वपूर्ण भविष्यवक्ता हैं।

गुणांक अनुमान के लिए विश्वास अंतराल

तालिका के अंतिम दो कॉलम गुणांक अनुमान के लिए 95% विश्वास अंतराल की निचली और ऊपरी सीमा प्रदान करते हैं।

उदाहरण के लिए, अध्ययन घंटों के लिए गुणांक अनुमान 1.299 है, लेकिन इस अनुमान के आसपास कुछ अनिश्चितता है। हम निश्चित रूप से कभी नहीं जान सकते कि यह सटीक गुणांक है या नहीं। तो 95% विश्वास अंतराल हमें वास्तविक गुणांक के लिए संभावित मूल्यों की एक श्रृंखला देता है।

इस मामले में, अध्ययन घंटों के लिए 95% आत्मविश्वास अंतराल (0.356, 2.24) है। ध्यान दें कि इस आत्मविश्वास अंतराल में संख्या “0” शामिल नहीं है, जिसका अर्थ है कि हम पूरी तरह से आश्वस्त हैं कि अध्ययन के घंटों के गुणांक का सही मूल्य गैर-शून्य है, अर्थात एक सकारात्मक संख्या है।

इसके विपरीत, प्रारंभिक परीक्षाओं के लिए 95% आत्मविश्वास अंतराल (-1.201, 3.436) है। ध्यान दें कि इस आत्मविश्वास अंतराल में संख्या “0” शामिल है , जिसका अर्थ है कि प्रारंभिक परीक्षाओं के गुणांक का सही मूल्य शून्य हो सकता है, यानी, अंतिम परीक्षा के परिणामों की भविष्यवाणी करने में महत्वपूर्ण नहीं है।

अतिरिक्त संसाधन

रेखीय प्रतिगमन के लिए शून्य परिकल्पना को समझना
प्रतिगमन में समग्र महत्व के लिए एफ टेस्ट को समझना
प्रतिगमन परिणामों की रिपोर्ट कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *