डमी वेरिएबल ट्रैप क्या है? (परिभाषा & #038; उदाहरण)
रैखिक प्रतिगमन एक ऐसी विधि है जिसका उपयोग हम एक या अधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को मापने के लिए कर सकते हैं।
हम आम तौर पर मात्रात्मक चर के साथ रैखिक प्रतिगमन का उपयोग करते हैं। कभी-कभी इन्हें “संख्यात्मक” चर कहा जाता है, ये वे चर होते हैं जो मापने योग्य मात्रा का प्रतिनिधित्व करते हैं। उदाहरणों में शामिल:
- एक घर में वर्ग फुट की संख्या
- किसी शहर की जनसंख्या का आकार
- किसी व्यक्ति की आयु
हालाँकि, कभी-कभी हम श्रेणीबद्ध चर को भविष्यवक्ता चर के रूप में उपयोग करना चाहते हैं। ये वेरिएबल हैं जो नाम या लेबल लेते हैं और श्रेणियों में आ सकते हैं। उदाहरणों में शामिल:
- आंखों का रंग (उदाहरण के लिए “नीला”, “हरा”, “भूरा”)
- लिंग (जैसे “पुरुष”, “महिला”)
- वैवाहिक स्थिति (जैसे “विवाहित”, “एकल”, “तलाकशुदा”)
श्रेणीबद्ध चर का उपयोग करते समय, केवल 1, 2, 3 जैसे मानों को “नीला”, “हरा” और “भूरा” जैसे मान निर्दिष्ट करने का कोई मतलब नहीं है, क्योंकि ऐसा कहने का कोई मतलब नहीं है वह हरा दोगुना है. नीला या भूरा जितना रंगीन, नीले से तीन गुना अधिक रंगीन है।
इसके बजाय, समाधान डमी वेरिएबल्स का उपयोग करना है। ये वे चर हैं जिन्हें हम विशेष रूप से प्रतिगमन विश्लेषण के लिए बनाते हैं और जो दो मानों में से एक लेते हैं: शून्य या एक।
हमें बनाने के लिए आवश्यक डमी वेरिएबल्स की संख्या k -1 के बराबर है जहां k श्रेणीगत वेरिएबल द्वारा लिए जा सकने वाले विभिन्न मानों की संख्या है।
उदाहरण के लिए, मान लीजिए कि हमारे पास निम्नलिखित डेटा सेट है और हम आय की भविष्यवाणी करने के लिए वैवाहिक स्थिति और उम्र का उपयोग करना चाहते हैं:
प्रतिगमन मॉडल में वैवाहिक स्थिति को भविष्यवक्ता चर के रूप में उपयोग करने के लिए, हमें इसे एक डमी चर में परिवर्तित करने की आवश्यकता है।
चूँकि यह वर्तमान में एक श्रेणीबद्ध चर है जो तीन अलग-अलग मान (“एकल”, “विवाहित”, या “तलाकशुदा”) ले सकता है, हमें k -1 = 3-1 = 2 डमी चर बनाने की आवश्यकता है।
इस डमी वेरिएबल को बनाने के लिए, हम “सिंगल” को आधार मान के रूप में छोड़ सकते हैं क्योंकि यह सबसे अधिक बार दिखाई देता है। तो, यहां बताया गया है कि हम वैवाहिक स्थिति को डमी चर में कैसे परिवर्तित करेंगे:
फिर हम प्रतिगमन मॉडल में आयु , विवाहित और तलाकशुदा को भविष्यवक्ता चर के रूप में उपयोग कर सकते हैं।
डमी वेरिएबल बनाते समय, जो समस्या उत्पन्न हो सकती है उसे डमी वेरिएबल ट्रैप के रूप में जाना जाता है। ऐसा तब होता है जब हम k -1 डमी वेरिएबल के बजाय k डमी वेरिएबल बनाते हैं।
जब ऐसा होता है, तो कम से कम दो डमी वेरिएबल पूर्ण बहुसंरेखता से पीड़ित होंगे। दूसरे शब्दों में, वे पूरी तरह से सहसंबद्ध होंगे। इसके परिणामस्वरूप प्रतिगमन गुणांकों और उनके संगत पी-मानों की गलत गणना होती है।
डमी वेरिएबल ट्रैप: जब बनाए गए डमी वेरिएबल्स की संख्या उन मानों की संख्या के बराबर होती है जो श्रेणीगत मान ले सकते हैं। इससे बहुसंरेखता होती है, जिसके परिणामस्वरूप प्रतिगमन गुणांक और पी-मूल्यों की गलत गणना होती है।
उदाहरण के लिए, मान लीजिए कि हम वैवाहिक स्थिति को निम्नलिखित डमी चर में परिवर्तित करते हैं:
इस मामले में, एकल और विवाहित पूरी तरह से सहसंबंधित हैं और उनका सहसंबंध गुणांक -1 है।
इसलिए जब हम एकाधिक रैखिक प्रतिगमन करते हैं, तो प्रतिगमन गुणांक गणना गलत होगी।
डमी वेरिएबल ट्रैप से कैसे बचें
डमी वेरिएबल्स के जाल से बचने के लिए आपको बस एक नियम याद रखना होगा:
यदि कोई श्रेणीबद्ध चर k विभिन्न मान ले सकता है, तो आपको प्रतिगमन मॉडल में उपयोग करने के लिए केवल k-1 डमी चर बनाना चाहिए।
उदाहरण के लिए, मान लीजिए कि आप एक श्रेणीगत चर “स्कूल का वर्ष” को डमी चर में बदलना चाहते हैं। मान लीजिए कि यह चर निम्नलिखित मान लेता है:
- प्रथम वर्ष का छात्र
- द्वितीय वर्ष का छात्र
- कनिष्ठ
- वरिष्ठ
चूँकि यह वेरिएबल 4 अलग-अलग मान ले सकता है, हम केवल 3 डमी वेरिएबल बनाएंगे। उदाहरण के लिए, हमारे डमी वैरिएबल हो सकते हैं:
- X 1 = 1 यदि द्वितीय वर्ष का छात्र है; 0 अन्यथा
- X 2 = 1 यदि कनिष्ठ; 0 अन्यथा
- एक्स 3 = 1 युवा वरिष्ठ; 0 अन्यथा
चूँकि डमी वेरिएबल्स की संख्या “स्कूल वर्ष” द्वारा लिए जा सकने वाले मानों की संख्या से एक कम है, हम डमी वेरिएबल ट्रैप और मल्टीकोलिनेरिटी समस्या से बच सकते हैं।
अतिरिक्त संसाधन
प्रतिगमन विश्लेषण में डमी चर का उपयोग कैसे करें
एकाधिक रेखीय प्रतिगमन का परिचय
प्रतिगमन में बहुसंरेखता के लिए एक मार्गदर्शिका