एसएएस में वेरिएंस इन्फ्लेशन फैक्टर (वीआईएफ) की गणना कैसे करें
प्रतिगमन विश्लेषण में, बहुसंरेखता तब होती है जब दो या दो से अधिक भविष्यवक्ता चर एक-दूसरे के साथ अत्यधिक सहसंबद्ध होते हैं, जैसे कि वे प्रतिगमन मॉडल में अद्वितीय या स्वतंत्र जानकारी प्रदान नहीं करते हैं।
यदि चर के बीच सहसंबंध की डिग्री काफी अधिक है, तो यह प्रतिगमन मॉडल को फिट करने और व्याख्या करने में समस्याएं पैदा कर सकता है।
बहुसंरेखता का पता लगाने का एक तरीका विचरण मुद्रास्फीति कारक (वीआईएफ) के रूप में जाना जाने वाला एक मीट्रिक का उपयोग करना है, जो एक प्रतिगमन मॉडल में व्याख्यात्मक चर के बीच सहसंबंध और सहसंबंध की ताकत को मापता है।
यह ट्यूटोरियल बताता है कि एसएएस में वीआईएफ की गणना कैसे करें।
उदाहरण: एसएएस में वीआईएफ की गणना
इस उदाहरण के लिए, हम एक डेटासेट बनाएंगे जो 10 बास्केटबॉल खिलाड़ियों की विशेषताओं का वर्णन करेगा:
/*create dataset*/ data my_data; input rating points assists rebounds; datalines ; 90 25 5 11 85 20 7 8 82 14 7 10 88 16 8 6 94 27 5 6 90 20 7 9 76 12 6 6 75 15 9 10 87 14 9 10 86 19 5 7 ; run ; /*view dataset*/ proc print data =my_data;
मान लीजिए कि हम प्रतिक्रिया चर के रूप में स्कोरिंग और भविष्यवक्ता चर के रूप में अंक , सहायता और रिबाउंड का उपयोग करके एक एकाधिक रैखिक प्रतिगमन मॉडल फिट करना चाहते हैं।
हम मॉडल में प्रत्येक पूर्वसूचक चर के लिए VIF मानों की गणना करने के लिए इस प्रतिगमन मॉडल को VIF विकल्प के साथ फिट करने के लिए PROC REG का उपयोग कर सकते हैं:
/*fit regression model and calculate VIF values*/ proc reg data =my_data; model rating = points assists rebounds / lively ; run ;
पैरामीटर अनुमान तालिका से, हम प्रत्येक भविष्यवक्ता चर के लिए वीआईएफ मान देख सकते हैं:
- अंक: 1.76398
- सहायता: 1.96591
- रिबाउंड: 1.17503
नोट: टेम्प्लेट में “इंटरसेप्ट” के लिए वीआईएफ पर ध्यान न दें क्योंकि यह मान प्रासंगिक नहीं है।
वीआईएफ मान 1 से शुरू होता है और इसकी कोई ऊपरी सीमा नहीं है। वीआईएफ की व्याख्या के लिए एक सामान्य नियम है:
- 1 का मान इंगित करता है कि किसी दिए गए भविष्यवक्ता चर और मॉडल में किसी अन्य भविष्यवक्ता चर के बीच कोई संबंध नहीं है।
- 1 और 5 के बीच का मान किसी दिए गए भविष्यवक्ता चर और मॉडल में अन्य भविष्यवक्ता चर के बीच एक मध्यम सहसंबंध को इंगित करता है, लेकिन यह अक्सर इतना गंभीर नहीं होता है कि विशेष ध्यान देने की आवश्यकता हो।
- 5 से अधिक का मान किसी दिए गए भविष्यवक्ता चर और मॉडल में अन्य भविष्यवक्ता चर के बीच संभावित गंभीर सहसंबंध को इंगित करता है। इस मामले में, प्रतिगमन परिणामों में गुणांक अनुमान और पी-मान अविश्वसनीय होने की संभावना है।
चूँकि हमारे प्रतिगमन मॉडल में भविष्यवक्ता चर का प्रत्येक VIF मान 1 के करीब है, हमारे उदाहरण में बहुसंरेखता कोई मुद्दा नहीं है।
बहुसंरेखता से कैसे निपटें
यदि आप यह निर्धारित करते हैं कि बहुसंरेखता आपके प्रतिगमन मॉडल में एक समस्या है, तो इसे हल करने के कई सामान्य तरीके हैं:
1. अत्यधिक सहसंबद्ध चरों में से एक या अधिक को हटा दें।
अधिकांश मामलों में यह सबसे तेज़ समाधान है और अक्सर एक स्वीकार्य समाधान होता है क्योंकि आपके द्वारा हटाए गए वेरिएबल वैसे भी अनावश्यक होते हैं और मॉडल में थोड़ी अनूठी या स्वतंत्र जानकारी जोड़ते हैं।
2. किसी तरह से भविष्यवक्ता चर को रैखिक रूप से जोड़ता है, जैसे उन्हें किसी तरह से जोड़ना या घटाना।
ऐसा करने से, आप एक नया वेरिएबल बना सकते हैं जिसमें दोनों वेरिएबल्स की जानकारी शामिल होती है और अब आपको बहुसंरेखता की समस्या नहीं होगी।
3. प्रमुख घटक विश्लेषण या आंशिक न्यूनतम वर्ग (पीएलएस) प्रतिगमन जैसे अत्यधिक सहसंबद्ध चर को ध्यान में रखते हुए डिज़ाइन किया गया विश्लेषण करें।
ये तकनीकें विशेष रूप से अत्यधिक सहसंबद्ध भविष्यवक्ता चर को संभालने के लिए डिज़ाइन की गई हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि एसएएस में अन्य सामान्य कार्य कैसे करें:
एसएएस में मल्टीपल लीनियर रिग्रेशन कैसे करें
एसएएस में एक अवशिष्ट प्लॉट कैसे बनाएं
एसएएस में कुक दूरी की गणना कैसे करें