लॉजिस्टिक रिग्रेशन की 6 परिकल्पनाएँ (उदाहरण के साथ)
लॉजिस्टिक रिग्रेशन एक ऐसी विधि है जिसका उपयोग हम रिग्रेशन मॉडल को फिट करने के लिए कर सकते हैं जब प्रतिक्रिया चर द्विआधारी होता है।
किसी मॉडल को डेटा सेट में फ़िट करने से पहले, लॉजिस्टिक रिग्रेशन निम्नलिखित धारणाएँ बनाता है:
धारणा #1: प्रतिक्रिया चर द्विआधारी है
लॉजिस्टिक रिग्रेशन मानता है कि प्रतिक्रिया चर के केवल दो संभावित परिणाम हैं। यहां कुछ उदाहरण दिए गए हैं:
- हां या नहीं
- पुरुष या महिला
- सफल या असफल
- लिखित या अलिखित
- घातक या सौम्य
इस धारणा की जांच कैसे करें: बस प्रतिक्रिया चर में होने वाले अद्वितीय परिणामों की संख्या की गणना करें। यदि दो से अधिक संभावित परिणाम हैं, तो आपको इसके बजाय एक क्रमिक प्रतिगमन करने की आवश्यकता होगी।
परिकल्पना #2: अवलोकन स्वतंत्र हैं
लॉजिस्टिक रिग्रेशन मानता है कि डेटासेट में अवलोकन एक दूसरे से स्वतंत्र हैं। अर्थात्, अवलोकन एक ही व्यक्ति के बार-बार माप से नहीं आने चाहिए या किसी भी तरह से एक-दूसरे से संबंधित नहीं होने चाहिए।
इस परिकल्पना का परीक्षण कैसे करें: इस परिकल्पना का परीक्षण करने का सबसे सरल तरीका समय बनाम अवशेषों का एक प्लॉट बनाना है (यानी अवलोकनों का क्रम) और निरीक्षण करना है कि कोई यादृच्छिक प्रवृत्ति है या नहीं। यदि कोई यादृच्छिक पैटर्न नहीं है, तो इस धारणा का उल्लंघन हो सकता है।
परिकल्पना #3: व्याख्यात्मक चरों के बीच कोई बहुसंरेखता नहीं है
लॉजिस्टिक रिग्रेशन मानता है कि व्याख्यात्मक चरों के बीच कोई गंभीर बहुसंरेखता नहीं है।
बहुसंरेखता तब होती है जब दो या दो से अधिक व्याख्यात्मक चर एक-दूसरे के साथ अत्यधिक सहसंबद्ध होते हैं, जैसे कि वे प्रतिगमन मॉडल में अद्वितीय या स्वतंत्र जानकारी प्रदान नहीं करते हैं। यदि चर के बीच सहसंबंध की डिग्री काफी अधिक है, तो यह मॉडल को फिट करने और व्याख्या करने में समस्याएं पैदा कर सकता है।
उदाहरण के लिए, मान लें कि आप प्रतिक्रिया चर के रूप में अधिकतम ऊर्ध्वाधर छलांग और व्याख्यात्मक चर के रूप में निम्नलिखित चर का उपयोग करके एक लॉजिस्टिक रिग्रेशन करना चाहते हैं:
- खिलाड़ी का आकार
- खिलाड़ी का आकार
- प्रतिदिन अभ्यास में घंटों व्यतीत होते थे
इस मामले में, ऊँचाई और जूते के आकार में अत्यधिक सहसंबद्ध होने की संभावना है क्योंकि लम्बे लोगों के जूते का आकार बड़ा होता है। इसका मतलब यह है कि यदि हम प्रतिगमन में इन दो चर का उपयोग करते हैं तो बहुसंरेखता एक समस्या होगी।
इस धारणा की जांच कैसे करें: बहुसंरेखता का पता लगाने का सबसे आम तरीका विचरण मुद्रास्फीति कारक (वीआईएफ) का उपयोग करना है, जो एक प्रतिगमन मॉडल में भविष्यवक्ता चर के बीच सहसंबंध और सहसंबंध की ताकत को मापता है। वीआईएफ मानों की गणना और व्याख्या करने के तरीके की विस्तृत व्याख्या के लिए इस ट्यूटोरियल को देखें।
धारणा #4: कोई चरम आउटलेर नहीं हैं
लॉजिस्टिक रिग्रेशन मानता है कि डेटा सेट में कोई अत्यधिक आउटलेयर या प्रभावशाली अवलोकन नहीं हैं।
इस धारणा की जांच कैसे करें: डेटासेट में अत्यधिक आउटलेर्स और प्रभावशाली अवलोकनों के परीक्षण का सबसे आम तरीका प्रत्येक अवलोकन के लिए कुक की दूरी की गणना करना है। यदि वास्तव में आउटलेयर हैं, तो आप चुन सकते हैं (1) उन्हें हटा दें, (2) उन्हें माध्य या मध्यिका जैसे मान से बदल दें, या (3) बस उन्हें मॉडल में रखें लेकिन प्रतिगमन की रिपोर्ट करते समय उन्हें नोट करें . परिणाम।
परिकल्पना #5: व्याख्यात्मक चर और प्रतिक्रिया चर के लॉगिट के बीच एक रैखिक संबंध है
लॉजिस्टिक रिग्रेशन मानता है कि प्रत्येक व्याख्यात्मक चर और प्रतिक्रिया चर के लॉगिट के बीच एक रैखिक संबंध है। याद रखें कि लॉगिट को इस प्रकार परिभाषित किया गया है:
लॉगिट(पी) = लॉग(पी / (1-पी)) जहां पी सकारात्मक परिणाम की संभावना है।
इस परिकल्पना का परीक्षण कैसे करें: यह देखने का सबसे आसान तरीका है कि यह परिकल्पना सत्य है या नहीं, बॉक्स-टिडवेल परीक्षण का उपयोग करना है।
धारणा #6: नमूना आकार काफी बड़ा है
लॉजिस्टिक रिग्रेशन मानता है कि फिट किए गए लॉजिस्टिक रिग्रेशन मॉडल से वैध निष्कर्ष निकालने के लिए डेटासेट का नमूना आकार काफी बड़ा है।
इस परिकल्पना की जांच कैसे करें: एक नियम के रूप में, आपके पास प्रत्येक व्याख्यात्मक चर के लिए कम से कम लगातार परिणाम वाले कम से कम 10 मामले होने चाहिए। उदाहरण के लिए, यदि आपके पास 3 व्याख्यात्मक चर हैं और सबसे कम बारंबार परिणाम की अपेक्षित संभावना 0.20 है, तो आपके पास कम से कम (10*3) / 0.20 = 150 का नमूना आकार होना चाहिए।
लॉजिस्टिक रिग्रेशन बनाम की धारणाएं रेखीय प्रतिगमन
रैखिक प्रतिगमन के विपरीत, लॉजिस्टिक प्रतिगमन की आवश्यकता नहीं है:
- व्याख्यात्मक चर और प्रतिक्रिया चर के बीच एक रैखिक संबंध।
- मॉडल के अवशेषों को सामान्य रूप से वितरित किया जाना है।
- अवशिष्टों में निरंतर भिन्नता होनी चाहिए, जिसे होमोसेडैस्टिसिटी भी कहा जाता है।
संबंधित: रेखीय प्रतिगमन की चार मान्यताएँ
अतिरिक्त संसाधन
वास्तविक जीवन में लॉजिस्टिक रिग्रेशन का उपयोग करने के 4 उदाहरण
एसपीएसएस में लॉजिस्टिक रिग्रेशन कैसे करें
एक्सेल में लॉजिस्टिक रिग्रेशन कैसे करें
स्टाटा में लॉजिस्टिक रिग्रेशन कैसे करें