प्रतिगमन में बहुसंरेखता और वीआईएफ के लिए एक गाइड


प्रतिगमन विश्लेषण में बहुसंरेखता तब होती है जब दो या दो से अधिक भविष्यवक्ता चर एक-दूसरे के साथ अत्यधिक सहसंबद्ध होते हैं, जैसे कि वे प्रतिगमन मॉडल में अद्वितीय या स्वतंत्र जानकारी प्रदान नहीं करते हैं।

यदि चर के बीच सहसंबंध की डिग्री काफी अधिक है, तो यह प्रतिगमन मॉडल को फिट करने और व्याख्या करने में समस्याएं पैदा कर सकता है।

उदाहरण के लिए, मान लीजिए कि आप अधिकतम ऊर्ध्वाधर कूद प्रतिक्रिया चर और निम्नलिखित भविष्यवक्ता चर का उपयोग करके एक प्रतिगमन विश्लेषण चलाते हैं:

  • ऊंचाई
  • जूते का साइज़
  • प्रतिदिन अभ्यास में घंटों व्यतीत होते हैं

इस मामले में, ऊँचाई और जूते के आकार में अत्यधिक सहसंबद्ध होने की संभावना है, क्योंकि लम्बे लोगों के जूते का आकार बड़ा होता है। इसका मतलब यह है कि इस प्रतिगमन में बहुसंरेखता एक समस्या होने की संभावना है।

यह ट्यूटोरियल बताता है कि मल्टीकोलिनेरिटी एक समस्या क्यों है, इसका पता कैसे लगाया जाए और इसे कैसे ठीक किया जाए।

बहुसंरेखता एक समस्या क्यों है?

प्रतिगमन विश्लेषण का एक मुख्य लक्ष्य प्रत्येक भविष्यवक्ता चर और प्रतिक्रिया चर के बीच संबंध को अलग करना है।

विशेष रूप से, जब हम प्रतिगमन विश्लेषण करते हैं, तो हम प्रत्येक प्रतिगमन गुणांक की व्याख्या प्रतिक्रिया चर में औसत परिवर्तन के रूप में करते हैं, यह मानते हुए कि मॉडल में अन्य सभी भविष्यवक्ता चर स्थिर रहते हैं।

इसका मतलब यह है कि हम मानते हैं कि हम अन्य भविष्यवक्ता चर के मूल्यों को बदले बिना किसी दिए गए भविष्यवक्ता चर के मूल्यों को बदलने में सक्षम हैं।

हालाँकि, जब दो या दो से अधिक भविष्यवक्ता चर अत्यधिक सहसंबद्ध होते हैं, तो एक चर को दूसरे को बदले बिना बदलना मुश्किल हो जाता है।

इससे प्रतिगमन मॉडल के लिए प्रत्येक भविष्यवक्ता चर और प्रतिक्रिया चर के बीच संबंध का स्वतंत्र रूप से अनुमान लगाना मुश्किल हो जाता है, क्योंकि भविष्यवक्ता चर एकसमान में बदलते रहते हैं।

सामान्य तौर पर, बहुसंरेखता दो प्रकार की समस्याएँ उत्पन्न करती है:

  • मॉडल के गुणांक अनुमान (और यहां तक कि गुणांक के संकेत) मॉडल में शामिल अन्य भविष्यवक्ता चर के आधार पर काफी उतार-चढ़ाव कर सकते हैं।
  • गुणांक अनुमानों की सटीकता कम हो जाती है, जिससे पी-मान अविश्वसनीय हो जाते हैं। इससे यह निर्धारित करना मुश्किल हो जाता है कि कौन से भविष्यवक्ता चर वास्तव में सांख्यिकीय रूप से महत्वपूर्ण हैं।

बहुसंरेखता का पता कैसे लगाएं

बहुसंरेखता का पता लगाने का सबसे आम तरीका विचरण मुद्रास्फीति कारक (वीआईएफ) का उपयोग करना है, जो एक प्रतिगमन मॉडल में भविष्यवक्ता चर के बीच सहसंबंध और सहसंबंध की ताकत को मापता है।

वेरिएंस इन्फ्लेशन फैक्टर (वीआईएफ) का उपयोग करना

अधिकांश सांख्यिकीय सॉफ़्टवेयर में प्रतिगमन मॉडल के लिए वीआईएफ की गणना करने की क्षमता होती है। वीआईएफ मान 1 से शुरू होता है और इसकी कोई ऊपरी सीमा नहीं है। वीआईएफ की व्याख्या के लिए एक सामान्य नियम है:

  • 1 का मान इंगित करता है कि किसी दिए गए भविष्यवक्ता चर और मॉडल में किसी अन्य भविष्यवक्ता चर के बीच कोई संबंध नहीं है।
  • 1 और 5 के बीच का मान किसी दिए गए भविष्यवक्ता चर और मॉडल में अन्य भविष्यवक्ता चर के बीच एक मध्यम सहसंबंध को इंगित करता है, लेकिन यह अक्सर इतना गंभीर नहीं होता है कि विशेष ध्यान देने की आवश्यकता हो।
  • 5 से अधिक का मान किसी दिए गए भविष्यवक्ता चर और मॉडल में अन्य भविष्यवक्ता चर के बीच संभावित गंभीर सहसंबंध को इंगित करता है। इस मामले में, प्रतिगमन परिणामों में गुणांक अनुमान और पी-मान अविश्वसनीय होने की संभावना है।

उदाहरण के लिए, मान लीजिए कि हम बास्केटबॉल खिलाड़ियों की अधिकतम ऊर्ध्वाधर छलांग की भविष्यवाणी करने और निम्नलिखित परिणाम प्राप्त करने के लिए भविष्यवक्ता चर ऊंचाई , जूते का आकार और प्रति दिन प्रशिक्षण में बिताए गए घंटों का उपयोग करके एक प्रतिगमन विश्लेषण करते हैं:

अंतिम कॉलम में, हम देख सकते हैं कि ऊंचाई और जूते के आकार दोनों के लिए वीआईएफ मान 5 से अधिक हैं। यह इंगित करता है कि वे बहुसंरेखता से पीड़ित हैं और उनके गुणांक अनुमान और पी-मान संभवतः अविश्वसनीय हैं।

यदि हम जूते के आकार के लिए गुणांक अनुमान को देखते हैं, तो मॉडल हमें बताता है कि जूते के आकार में प्रत्येक अतिरिक्त इकाई वृद्धि के लिए, अधिकतम ऊर्ध्वाधर छलांग में औसत वृद्धि -0.67498 इंच है, यह मानते हुए कि ऊंचाई और अभ्यास के घंटे स्थिर रहते हैं।

इसका कोई मतलब नहीं लगता है, यह देखते हुए कि हम बड़े जूते वाले खिलाड़ियों से अपेक्षा करेंगे कि वे लम्बे हों और इस प्रकार उनकी अधिकतम ऊर्ध्वाधर छलांग अधिक हो।

यह बहुसंरेखता का एक उत्कृष्ट उदाहरण है जो गुणांक अनुमानों को थोड़ा दूर की कौड़ी और सहज ज्ञान युक्त नहीं बनाता है।

बहुसंरेखता को कैसे हल करें

यदि आप बहुसंरेखता का पता लगाते हैं, तो अगला कदम यह तय करना है कि आपको इसे किसी तरह हल करने की आवश्यकता है या नहीं। आपके प्रतिगमन विश्लेषण के लक्ष्य के आधार पर, आपको बहुसंरेखता को हल करने की आवश्यकता नहीं हो सकती है।

जानने के:

1. यदि केवल मध्यम बहुसंरेखता है, तो संभवतः आपको इसे किसी भी तरह से हल करने की आवश्यकता नहीं होगी।

2. बहुसंरेखता केवल भविष्यवक्ता चर को प्रभावित करती है जो एक दूसरे के साथ सहसंबद्ध होते हैं। यदि आप मॉडल में एक भविष्यवक्ता चर में रुचि रखते हैं जो मल्टीकोलिनेरिटी से ग्रस्त नहीं है, तो मल्टीकोलिनेरिटी कोई समस्या नहीं है।

3. बहुसंरेखता गुणांक अनुमानों और पी-मूल्यों को प्रभावित करती है, लेकिन यह भविष्यवाणियों या फिट-ऑफ-फिट आंकड़ों को प्रभावित नहीं करती है। इसका मतलब यह है कि यदि प्रतिगमन के साथ आपका प्राथमिक लक्ष्य भविष्यवाणियां करना है और आप भविष्यवक्ता चर और प्रतिक्रिया चर के बीच सटीक संबंध को समझने में रुचि नहीं रखते हैं, तो बहुसंरेखता को हल करने की आवश्यकता नहीं है।

यदि आप यह निर्धारित करते हैं कि आपको बहुसंरेखता को ठीक करने की आवश्यकता है , तो कुछ सामान्य समाधानों में शामिल हैं:

1. अत्यधिक सहसंबद्ध चरों में से एक या अधिक को हटा दें। अधिकांश मामलों में यह सबसे तेज़ समाधान है और अक्सर एक स्वीकार्य समाधान होता है क्योंकि आपके द्वारा हटाए गए वेरिएबल वैसे भी अनावश्यक होते हैं और मॉडल में थोड़ी अनूठी या स्वतंत्र जानकारी जोड़ते हैं।

2. किसी तरह से भविष्यवक्ता चर को रैखिक रूप से जोड़ता है, जैसे उन्हें किसी तरह से जोड़ना या घटाना। ऐसा करने से, आप एक नया वेरिएबल बना सकते हैं जिसमें दोनों वेरिएबल्स की जानकारी शामिल होती है और अब आपको बहुसंरेखता की समस्या नहीं होगी।

3. अत्यधिक सहसंबद्ध चर, जैसे प्रमुख घटक विश्लेषण या आंशिक न्यूनतम वर्ग (पीएलएस) प्रतिगमन को ध्यान में रखते हुए डिज़ाइन किया गया विश्लेषण करें। ये तकनीकें विशेष रूप से अत्यधिक सहसंबद्ध भविष्यवक्ता चर को संभालने के लिए डिज़ाइन की गई हैं।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *