एक्सेल में द्विघात प्रतिगमन कैसे करें


प्रतिगमन एक सांख्यिकीय तकनीक है जिसका उपयोग हम एक या अधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को समझाने के लिए कर सकते हैं। प्रतिगमन का सबसे आम प्रकार रैखिक प्रतिगमन है, जिसका उपयोग हम तब करते हैं जब भविष्यवक्ता चर और प्रतिक्रिया चर के बीच संबंध रैखिक होता है।

दूसरे शब्दों में, जब भविष्यवक्ता चर बढ़ता है, तो प्रतिक्रिया चर भी बढ़ने लगता है। उदाहरण के लिए, हम अध्ययन किए गए घंटों की संख्या (भविष्यवक्ता चर) और एक छात्र को परीक्षा में प्राप्त ग्रेड (प्रतिक्रिया चर) के बीच संबंध का वर्णन करने के लिए एक रैखिक प्रतिगमन मॉडल का उपयोग कर सकते हैं।

हालाँकि, कभी-कभी भविष्यवक्ता चर और प्रतिक्रिया चर के बीच का संबंध अरेखीय होता है। एक सामान्य प्रकार का अरेखीय संबंध द्विघात संबंध है, जो ग्राफ़ पर यू या उल्टा यू जैसा दिख सकता है।

अर्थात्, जैसे-जैसे भविष्यवक्ता चर बढ़ता है, प्रतिक्रिया चर भी बढ़ता जाता है, लेकिन एक निश्चित बिंदु के बाद प्रतिक्रिया चर कम होने लगता है क्योंकि भविष्यवक्ता चर बढ़ता रहता है।

उदाहरण के लिए, हम काम में बिताए गए घंटों की संख्या और किसी व्यक्ति की खुशी के रिपोर्ट किए गए स्तर के बीच संबंध का वर्णन करने के लिए एक द्विघात प्रतिगमन मॉडल का उपयोग कर सकते हैं। शायद कोई व्यक्ति जितना अधिक काम करता है, उतना ही अधिक संतुष्ट महसूस करता है, लेकिन एक बार जब वह एक निश्चित सीमा तक पहुंच जाता है, तो अधिक काम वास्तव में तनाव और खुशी में कमी का कारण बनता है। इस मामले में, एक द्विघात प्रतिगमन मॉडल एक रैखिक प्रतिगमन मॉडल की तुलना में डेटा को बेहतर ढंग से फिट करेगा।

आइए Excel में द्विघात प्रतिगमन कैसे करें इसके एक उदाहरण की समीक्षा करें।

एक्सेल में द्विघात प्रतिगमन

मान लीजिए कि हमारे पास 16 अलग-अलग लोगों के लिए प्रति सप्ताह काम किए गए घंटों की संख्या और खुशी के रिपोर्ट किए गए स्तर (0 से 100 के पैमाने पर) का डेटा है:

सबसे पहले, आइए यह देखने के लिए एक स्कैटरप्लॉट बनाएं कि क्या रैखिक प्रतिगमन डेटा को फिट करने के लिए एक उपयुक्त मॉडल है।

सेल A2:B17 को हाइलाइट करें। इसके बाद, शीर्ष रिबन के साथ INSERT टैब पर क्लिक करें और फिर चार्ट क्षेत्र में स्कैटर पर क्लिक करें। यह डेटा का एक स्कैटरप्लॉट तैयार करेगा:

यह देखना आसान है कि काम के घंटे और रिपोर्ट की गई खुशी के बीच संबंध रैखिक नहीं है । वास्तव में, यह “यू” आकार का अनुसरण करता है, जो इसे द्विघात प्रतिगमन के लिए एक आदर्श उम्मीदवार बनाता है।

द्विघात प्रतिगमन मॉडल को डेटा में फिट करने से पहले, हमें अपने भविष्यवक्ता चर के वर्ग मानों के लिए एक नया कॉलम बनाने की आवश्यकता है।

सबसे पहले, कॉलम B में सभी मानों को हाइलाइट करें और उन्हें कॉलम C पर खींचें।

इसके बाद, सेल B2 में सूत्र =A2^2 टाइप करें। इससे मान 36 उत्पन्न होता है। इसके बाद, सेल B2 के निचले दाएं कोने पर क्लिक करें और कॉलम B में शेष सेल को भरने के लिए सूत्र को नीचे खींचें।

इसके बाद, हम द्विघात प्रतिगमन मॉडल को फिट करेंगे।

शीर्ष रिबन के साथ डेटा पर क्लिक करें, फिर सबसे दाईं ओर डेटा विश्लेषण विकल्प पर क्लिक करें। यदि आपको यह विकल्प दिखाई नहीं देता है, तो आपको पहले निःशुल्क विश्लेषण टूलपैक सॉफ़्टवेयर इंस्टॉल करना होगा।

जैसे ही आप डेटा विश्लेषण पर क्लिक करेंगे, एक बॉक्स दिखाई देगा। रिग्रेशन पर क्लिक करें और फिर ओके पर क्लिक करें।

इसके बाद दिखाई देने वाले रिग्रेशन बॉक्स में निम्नलिखित मान भरें। फिर ओके पर क्लिक करें.

निम्नलिखित परिणाम प्रदर्शित होंगे:

यहां आउटपुट में विभिन्न संख्याओं की व्याख्या करने का तरीका बताया गया है:

आर वर्ग: निर्धारण के गुणांक के रूप में भी जाना जाता है, यह प्रतिक्रिया चर में भिन्नता का अनुपात है जिसे भविष्यवक्ता चर द्वारा समझाया जा सकता है। इस उदाहरण में, आर वर्ग 0.9092 है, जो दर्शाता है कि रिपोर्ट किए गए खुशी के स्तर में 90.92% अंतर को काम किए गए घंटों की संख्या और काम किए गए घंटों की संख्या ^2 द्वारा समझाया जा सकता है।

मानक त्रुटि: प्रतिगमन की मानक त्रुटि प्रेक्षित मानों और प्रतिगमन रेखा के बीच की औसत दूरी है। इस उदाहरण में, देखे गए मान प्रतिगमन रेखा से औसतन 9,519 इकाइयों तक विचलित होते हैं।

एफ-सांख्यिकी : एफ-सांख्यिकी की गणना प्रतिगमन एमएस/अवशिष्ट एमएस के रूप में की जाती है। यह आँकड़ा इंगित करता है कि क्या प्रतिगमन मॉडल उस मॉडल की तुलना में डेटा के लिए बेहतर फिट प्रदान करता है जिसमें कोई स्वतंत्र चर नहीं है। मूलतः, यह परीक्षण करता है कि समग्र रूप से प्रतिगमन मॉडल उपयोगी है या नहीं। आम तौर पर, यदि मॉडल में कोई भी भविष्यवक्ता चर सांख्यिकीय रूप से महत्वपूर्ण नहीं है, तो समग्र एफ आँकड़ा भी सांख्यिकीय रूप से महत्वपूर्ण नहीं है। इस उदाहरण में, एफ आँकड़ा 65.09 है और संबंधित पी-मान <0.0001 है। चूँकि यह पी-मान 0.05 से कम है, इसलिए समग्र रूप से प्रतिगमन मॉडल महत्वपूर्ण है।

प्रतिगमन गुणांक: अंतिम तालिका में प्रतिगमन गुणांक हमें अनुमानित प्रतिगमन समीकरण लिखने के लिए आवश्यक संख्याएँ देते हैं:

y टोपी = बी 0 + बी 1 एक्स 1 + बी 2 एक्स 1 2

इस उदाहरण में, अनुमानित प्रतिगमन समीकरण है:

खुशी का घोषित स्तर = -30.252 + 7.173 (काम के घंटे) -0.106 (काम के घंटे) 2

हम इस समीकरण का उपयोग किसी व्यक्ति के काम किए गए घंटों के आधार पर उसकी खुशी के अपेक्षित स्तर की गणना करने के लिए कर सकते हैं। उदाहरण के लिए, प्रति सप्ताह 30 घंटे काम करने वाले व्यक्ति की खुशी का अपेक्षित स्तर है:

खुशी का सूचित स्तर = -30.252 + 7.173(30) -0.106(30) 2 = 88.649

अतिरिक्त संसाधन

एक्सेल में द्विघात ट्रेंड लाइन कैसे जोड़ें
प्रतिगमन तालिका को कैसे पढ़ें और व्याख्या करें

एक अच्छा आर-वर्ग मान क्या है?
प्रतिगमन की मानक त्रुटि को समझना
प्रतिगमन में समग्र महत्व के एफ-टेस्ट को समझने के लिए एक सरल मार्गदर्शिका

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *