प्रतिगमन विश्लेषण
यह आलेख बताता है कि प्रतिगमन विश्लेषण क्या है और आंकड़ों में इसका उपयोग किस लिए किया जाता है। इसके अतिरिक्त, आप यह देख पाएंगे कि प्रतिगमन विश्लेषण के विभिन्न प्रकार क्या हैं।
प्रतिगमन विश्लेषण क्या है?
सांख्यिकी में, प्रतिगमन विश्लेषण एक ऐसी प्रक्रिया है जिसमें दो या दो से अधिक चरों के बीच संबंध का अध्ययन किया जाता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण में एक समीकरण की गणना करना शामिल है जो गणितीय रूप से अध्ययन में चर से संबंधित है।
प्रतिगमन विश्लेषण में निर्मित मॉडल को प्रतिगमन मॉडल कहा जाता है, जबकि अध्ययन किए गए चर से संबंधित समीकरण को प्रतिगमन समीकरण कहा जाता है।
उदाहरण के लिए, यदि आप किसी देश की मुद्रास्फीति और उसके सकल घरेलू उत्पाद के बीच संबंध का अध्ययन करना चाहते हैं, तो आप दो चर के बीच संबंध का विश्लेषण करने के लिए प्रतिगमन विश्लेषण कर सकते हैं। इस मामले में, प्रतिगमन विश्लेषण से प्राप्त समीकरण एक प्रतिगमन रेखा होगी।

इस प्रकार, एक प्रतिगमन विश्लेषण में डेटा का एक नमूना एकत्र करना शामिल है और, एकत्र किए गए डेटा से, एक समीकरण की गणना की जाती है जो अध्ययन किए गए चर को गणितीय रूप से संबंधित करने की अनुमति देता है।
प्रतिगमन विश्लेषण में, दो प्रकार के चर के बीच अंतर करना महत्वपूर्ण है जिन्हें प्रतिगमन मॉडल में शामिल किया जा सकता है:
- आश्रित चर (या प्रतिक्रिया चर) : यह वह कारक है जिसका हम विश्लेषण करना चाहते हैं, इसलिए यह देखने के लिए एक प्रतिगमन मॉडल बनाया जाएगा कि इस चर का मूल्य अन्य चर के मूल्य के आधार पर कैसे भिन्न होता है।
- स्वतंत्र चर (या व्याख्यात्मक चर) : यह एक ऐसा कारक है जिसे हम उस चर को प्रभावित करने की संभावना मानते हैं जिसका हम विश्लेषण करना चाहते हैं। अर्थात् स्वतंत्र चर का मान आश्रित चर के मान को प्रभावित करता है।
प्रतिगमन विश्लेषण के प्रकार
मूल रूप से, प्रतिगमन विश्लेषण तीन प्रकार के होते हैं:
- सरल रेखीय प्रतिगमन विश्लेषण : प्रतिगमन मॉडल में एक स्वतंत्र चर और एक आश्रित चर होता है और वे रैखिक रूप से संबंधित होते हैं।
- एकाधिक रैखिक प्रतिगमन विश्लेषण : दो या दो से अधिक स्वतंत्र चर रैखिक रूप से एक आश्रित चर से संबंधित होते हैं।
- नॉनलीनियर रिग्रेशन विश्लेषण : स्वतंत्र चर और आश्रित चर के बीच संबंध को नॉनलीनियर फ़ंक्शन का उपयोग करके तैयार किया जाता है।
सरल रेखीय प्रतिगमन विश्लेषण
सरल रेखीय प्रतिगमन का उपयोग एक रेखीय समीकरण का उपयोग करके एक स्वतंत्र चर को दोनों चर से जोड़ने के लिए किया जाता है।
एक सरल रेखीय प्रतिगमन मॉडल का समीकरण एक सीधी रेखा है, इसलिए यह दो गुणांकों से बना है: समीकरण का स्थिरांक (β 0 ) और दो चर (β 1 ) के बीच सहसंबंध गुणांक। इसलिए, एक सरल रैखिक प्रतिगमन मॉडल के लिए समीकरण y=β 0 +β 1 x है।
सरल रेखीय प्रतिगमन के गुणांकों की गणना के सूत्र इस प्रकार हैं:
सोना:
-
प्रतिगमन रेखा का स्थिरांक है।
-
प्रतिगमन रेखा का ढलान है.
-
डेटा i के स्वतंत्र चर X का मान है।
-
डेटा i के आश्रित चर Y का मान है।
-
स्वतंत्र चर के मानों का औसत है
-
आश्रित चर Y के मानों का औसत है।
एकाधिक रैखिक प्रतिगमन विश्लेषण
एकाधिक रेखीय प्रतिगमन मॉडल में, कम से कम दो स्वतंत्र चर शामिल होते हैं। दूसरे शब्दों में, एकाधिक रेखीय प्रतिगमन कई व्याख्यात्मक चर को प्रतिक्रिया चर से रैखिक रूप से जोड़ने की अनुमति देता है। इसलिए, एकाधिक रैखिक प्रतिगमन मॉडल के लिए समीकरण है:
सोना:
-
आश्रित चर है.
-
स्वतंत्र चर है i.
-
बहुरेखीय प्रतिगमन समीकरण का स्थिरांक है।
-
चर से जुड़ा प्रतिगमन गुणांक है
.
-
त्रुटि या अवशिष्ट है, यानी देखे गए मूल्य और मॉडल द्वारा अनुमानित मूल्य के बीच का अंतर है।
-
मॉडल में चरों की कुल संख्या है।
तो अगर हमारे पास कुल मिलाकर एक नमूना है
अवलोकनों के अनुसार, हम एकाधिक रैखिक प्रतिगमन मॉडल को मैट्रिक्स रूप में प्रस्तुत कर सकते हैं:
उपरोक्त मैट्रिक्स अभिव्यक्ति को प्रत्येक मैट्रिक्स को एक अक्षर निर्दिष्ट करके फिर से लिखा जा सकता है:
इस प्रकार, न्यूनतम वर्ग मानदंड को लागू करके, हम एकाधिक रैखिक प्रतिगमन मॉडल के गुणांक का अनुमान लगाने के सूत्र पर पहुंच सकते हैं:
हालाँकि, इस सूत्र का अनुप्रयोग बहुत श्रमसाध्य और समय लेने वाला है, यही कारण है कि व्यवहार में कंप्यूटर सॉफ़्टवेयर (जैसे मिनीटैब या एक्सेल) का उपयोग करने की अनुशंसा की जाती है जो कई प्रतिगमन मॉडल को अधिक तेज़ी से बनाने की अनुमति देता है।
अरेखीय प्रतिगमन विश्लेषण
आंकड़ों में, नॉनलाइनियर रिग्रेशन एक प्रकार का रिग्रेशन है जिसमें एक नॉनलाइनियर फ़ंक्शन का उपयोग रिग्रेशन समीकरण के मॉडल के रूप में किया जाता है। इसलिए, एक अरेखीय प्रतिगमन मॉडल का समीकरण एक अरेखीय फलन है।
तार्किक रूप से, गैर-रेखीय प्रतिगमन का उपयोग स्वतंत्र चर को आश्रित चर से जोड़ने के लिए किया जाता है जब दो चर के बीच संबंध रैखिक नहीं होता है। इसलिए, यदि नमूना डेटा को रेखांकन करते समय हम देखते हैं कि उनका कोई रैखिक संबंध नहीं है, यानी, वे लगभग एक सीधी रेखा नहीं बनाते हैं, तो गैर-रेखीय प्रतिगमन मॉडल का उपयोग करना बेहतर है।
उदाहरण के लिए, समीकरण y=3-5x-8x 2 +x 3 एक अरेखीय प्रतिगमन मॉडल है क्योंकि यह गणितीय रूप से स्वतंत्र चर X को एक घन फ़ंक्शन के माध्यम से आश्रित चर Y से जोड़ता है।
अरेखीय प्रतिगमन मुख्यतः तीन प्रकार के होते हैं:
- बहुपद प्रतिगमन – अरैखिक प्रतिगमन जिसका समीकरण बहुपद के रूप में होता है।
- लघुगणक प्रतिगमन – अरेखीय प्रतिगमन जिसमें स्वतंत्र चर को लघुगणकीकृत किया जाता है।
- घातीय प्रतिगमन – अरेखीय प्रतिगमन जिसमें स्वतंत्र चर समीकरण के घातांक में रहता है।
प्रतिगमन विश्लेषण किसके लिए प्रयोग किया जाता है?
प्रतिगमन विश्लेषण के मूल रूप से दो उपयोग हैं: प्रतिगमन विश्लेषण का उपयोग व्याख्यात्मक चर और प्रतिक्रिया चर के बीच संबंध को समझाने के लिए किया जाता है और इसी तरह, प्रतिगमन विश्लेषण का उपयोग एक नए अवलोकन के लिए आश्रित चर के मूल्य की भविष्यवाणी करने के लिए किया जाता है।
प्रतिगमन मॉडल का समीकरण प्राप्त करके, हम जान सकते हैं कि मॉडल में चर के बीच किस प्रकार का संबंध मौजूद है। यदि किसी स्वतंत्र चर का प्रतिगमन गुणांक सकारात्मक है, तो उसके बढ़ने पर आश्रित चर भी बढ़ेगा। जबकि यदि किसी स्वतंत्र चर का प्रतिगमन गुणांक ऋणात्मक है, तो आश्रित चर बढ़ने पर घट जाएगा।
दूसरी ओर, प्रतिगमन विश्लेषण से प्राप्त गणितीय समीकरण हमें मूल्य पूर्वानुमान लगाने की भी अनुमति देता है। इस प्रकार, प्रतिगमन मॉडल के समीकरण में व्याख्यात्मक चर के मूल्यों को पेश करके, हम डेटा के एक नए टुकड़े के लिए आश्रित चर के मूल्य की गणना कर सकते हैं।