रेखीय प्रतिगमन के साथ भविष्यवाणियाँ कैसे करें
रैखिक प्रतिगमन एक ऐसी विधि है जिसका उपयोग हम एक या अधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को मापने के लिए कर सकते हैं।
प्रतिगमन मॉडल को फिट करने के सबसे सामान्य कारणों में से एक नए अवलोकनों के मूल्यों की भविष्यवाणी करने के लिए मॉडल का उपयोग करना है।
प्रतिगमन मॉडल के साथ पूर्वानुमान लगाने के लिए हम निम्नलिखित चरणों का उपयोग करते हैं:
- चरण 1: डेटा एकत्र करें.
- चरण 2: डेटा में एक प्रतिगमन मॉडल फिट करें।
- चरण 3: सत्यापित करें कि मॉडल डेटा पर फिट बैठता है।
- चरण 4: नए अवलोकनों के मूल्यों की भविष्यवाणी करने के लिए फिट किए गए प्रतिगमन समीकरण का उपयोग करें।
निम्नलिखित उदाहरण दिखाते हैं कि पूर्वानुमान लगाने के लिए प्रतिगमन मॉडल का उपयोग कैसे करें।
उदाहरण 1: एक सरल रैखिक प्रतिगमन मॉडल के साथ भविष्यवाणियाँ करना
मान लीजिए कि एक डॉक्टर 50 रोगियों की ऊंचाई (इंच में) और वजन (पाउंड में) पर डेटा एकत्र करता है।
इसके बाद यह भविष्यवक्ता चर के रूप में “वजन” और प्रतिक्रिया चर के रूप में “ऊंचाई” का उपयोग करके एक सरल रैखिक प्रतिगमन मॉडल में फिट बैठता है।
फिट प्रतिगमन समीकरण है:
आकार = 32.7830 + 0.2001*(वजन)
यह सत्यापित करने के बाद कि रैखिक प्रतिगमन मॉडल की धारणाएँ पूरी हो गई हैं, डॉक्टर ने निष्कर्ष निकाला कि मॉडल डेटा को अच्छी तरह से फिट बैठता है।
इसके बाद यह नए रोगियों के वजन के आधार पर उनकी ऊंचाई का अनुमान लगाने के लिए मॉडल का उपयोग कर सकता है।
उदाहरण के लिए, मान लें कि एक नए मरीज का वजन 170 पाउंड है। मॉडल का उपयोग करके, हम अनुमान लगाएंगे कि इस मरीज की ऊंचाई 66.8 इंच होगी:
ऊंचाई = 32.7830 + 0.2001*(170) = 66.8 इंच
उदाहरण 2: एकाधिक रेखीय प्रतिगमन मॉडल के साथ भविष्यवाणियाँ करना
मान लें कि एक अर्थशास्त्री 30 लोगों की शिक्षा के कुल वर्षों, काम के साप्ताहिक घंटे और वार्षिक आय पर डेटा एकत्र करता है।
इसके बाद यह “शिक्षा के कुल वर्ष” और “साप्ताहिक काम के घंटे” को भविष्यवक्ता चर के रूप में और “वार्षिक आय” को प्रतिक्रिया चर के रूप में उपयोग करते हुए एक बहु रेखीय प्रतिगमन मॉडल में फिट बैठता है।
फिट प्रतिगमन समीकरण है:
आय = 1,342.29 + 3,324.33*(स्कूली शिक्षा के वर्ष) + 765.88*(साप्ताहिक काम के घंटे)
यह सत्यापित करने के बाद कि रैखिक प्रतिगमन मॉडल की धारणाएँ पूरी हो गई हैं, अर्थशास्त्री ने निष्कर्ष निकाला कि मॉडल डेटा को अच्छी तरह से फिट बैठता है।
इसके बाद यह किसी नए व्यक्ति की शिक्षा के कुल वर्षों और काम किए गए साप्ताहिक घंटों के आधार पर उसकी वार्षिक आय की भविष्यवाणी करने के लिए मॉडल का उपयोग कर सकता है।
उदाहरण के लिए, मान लीजिए कि एक नए व्यक्ति के पास कुल मिलाकर 16 साल की शिक्षा है और वह प्रति सप्ताह औसतन 40 घंटे काम करता है। मॉडल का उपयोग करके, हम अनुमान लगाएंगे कि इस व्यक्ति की वार्षिक आय $85,166.77 होगी:
आय = 1,342.29 + 3,324.33*(16) + 765.88*(45) = $85,166.77
आत्मविश्वास अंतराल के उपयोग पर
जब आप नए अवलोकनों के बारे में पूर्वानुमान लगाने के लिए प्रतिगमन मॉडल का उपयोग करते हैं, तो प्रतिगमन मॉडल द्वारा अनुमानित मूल्य को बिंदु अनुमान कहा जाता है।
यद्यपि बिंदु अनुमान नए अवलोकन के मूल्य के हमारे सर्वोत्तम अनुमान का प्रतिनिधित्व करता है, लेकिन यह नए अवलोकन के मूल्य से बिल्कुल मेल खाने की संभावना नहीं है।
इसलिए, इस अनिश्चितता को पकड़ने के लिए, हम एक आत्मविश्वास अंतराल बना सकते हैं – मूल्यों की एक श्रृंखला जिसमें आत्मविश्वास के एक निश्चित स्तर के साथ जनसंख्या पैरामीटर शामिल होने की संभावना है।
उदाहरण के लिए, यह अनुमान लगाने के बजाय कि एक नया व्यक्ति 66.8 इंच लंबा होगा, हम निम्नलिखित आत्मविश्वास अंतराल बना सकते हैं:
95% आत्मविश्वास अंतराल = [64.8 इंच, 68.8 इंच]
हम इस अंतराल की व्याख्या इस तरह करेंगे कि हम 95% आश्वस्त हैं कि इस व्यक्ति की वास्तविक ऊंचाई 64.8 इंच और 68.8 इंच के बीच है।
भविष्यवाणी करते समय बरती जाने वाली सावधानियाँ
पूर्वानुमान लगाने के लिए प्रतिगमन मॉडल का उपयोग करते समय निम्नलिखित बातों को ध्यान में रखें:
1. प्रतिगमन मॉडल का अनुमान लगाने के लिए उपयोग किए जाने वाले डेटा की सीमा के भीतर ही पूर्वानुमान लगाने के लिए मॉडल का उपयोग करें।
उदाहरण के लिए, मान लीजिए कि हम भविष्यवक्ता चर “वजन” का उपयोग करके एक प्रतिगमन मॉडल फिट कर रहे थे और मॉडल का अनुमान लगाने के लिए हमने जिस नमूने का उपयोग किया था उसमें व्यक्तियों का वजन 120 और 180 पाउंड के बीच था।
200 पाउंड वजन वाले व्यक्ति की ऊंचाई का अनुमान लगाने के लिए मॉडल का उपयोग करना मान्य नहीं होगा, क्योंकि यह उस भविष्यवक्ता चर की सीमा से बाहर है जिसका उपयोग हम मॉडल का अनुमान लगाने के लिए करते थे।
यह संभव है कि वजन और ऊंचाई के बीच का संबंध 120 से 180 पाउंड की सीमा के बाहर भिन्न हो। इसलिए हमें 200 पाउंड वजन वाले व्यक्ति की ऊंचाई का अनुमान लगाने के लिए मॉडल का उपयोग नहीं करना चाहिए।
2. मॉडल का उपयोग केवल आपके द्वारा नमूना की गई जनसंख्या के लिए पूर्वानुमान लगाने के लिए करें।
उदाहरण के लिए, मान लीजिए कि एक अर्थशास्त्री किसी विशेष शहर में रहने वाले सभी लोगों के नमूने से जनसंख्या खींचता है।
हमें इस शहर में व्यक्तियों की वार्षिक आय की भविष्यवाणी करने के लिए केवल फिट किए गए प्रतिगमन मॉडल का उपयोग करना चाहिए क्योंकि मॉडल को फिट करने के लिए उपयोग किया जाने वाला पूरा नमूना इसी शहर में रहता था।
अतिरिक्त संसाधन
सरल रेखीय प्रतिगमन का परिचय
एकाधिक रेखीय प्रतिगमन का परिचय
आत्मविश्वास अंतराल का परिचय
रैखिक प्रतिगमन की चार धारणाएँ