एक्सेल में आरओसी कर्व कैसे बनाएं (चरण दर चरण)


लॉजिस्टिक रिग्रेशन एक सांख्यिकीय पद्धति है जिसका उपयोग हम रिग्रेशन मॉडल को फिट करने के लिए करते हैं जब प्रतिक्रिया चर द्विआधारी होता है। यह मूल्यांकन करने के लिए कि लॉजिस्टिक रिग्रेशन मॉडल डेटा सेट में कितनी अच्छी तरह फिट बैठता है, हम निम्नलिखित दो मैट्रिक्स देख सकते हैं:

  • संवेदनशीलता: संभावना है कि मॉडल किसी अवलोकन के लिए सकारात्मक परिणाम की भविष्यवाणी करता है जब परिणाम वास्तव में सकारात्मक होता है। इसे “सच्ची सकारात्मक दर” भी कहा जाता है।
  • विशिष्टता: संभावना है कि मॉडल किसी अवलोकन के लिए नकारात्मक परिणाम की भविष्यवाणी करता है जब परिणाम वास्तव में नकारात्मक होता है। इसे “सच्ची नकारात्मक दर” भी कहा जाता है।

इन दो मापों को देखने का एक तरीका एक आरओसी वक्र बनाना है, जो “रिसीवर ऑपरेटिंग विशेषता” वक्र के लिए है। यह एक ग्राफ़ है जो लॉजिस्टिक रिग्रेशन मॉडल की संवेदनशीलता और विशिष्टता को प्रदर्शित करता है।

निम्नलिखित चरण-दर-चरण उदाहरण दिखाता है कि एक्सेल में आरओसी वक्र कैसे बनाया और व्याख्या किया जाए।

चरण 1: डेटा दर्ज करें

आइए कुछ कच्चा डेटा दर्ज करके शुरुआत करें:

चरण 2: संचयी डेटा की गणना करें

तो आइए पास और फेल श्रेणियों के लिए संचयी मानों की गणना करने के लिए निम्नलिखित सूत्र का उपयोग करें:

  • संचयी सफलता मान: =SUM($B$3:B3)
  • संचयी विफलता मान: =SUM($C$3:C3)

फिर हम इन सूत्रों को कॉलम डी और कॉलम ई में प्रत्येक सेल में कॉपी और पेस्ट करेंगे:

चरण 3: झूठी सकारात्मक दर और सच्ची सकारात्मक दर की गणना करें

इसके बाद, हम निम्नलिखित सूत्रों का उपयोग करके झूठी सकारात्मक दर (एफपीआर), सच्ची सकारात्मक दर (टीपीआर), और वक्र के नीचे के क्षेत्र (एयूसी) की गणना करेंगे:

  • एफपीआर: =1-डी3/$डी$14
  • टीपीआर: =1-ई3/$ई$14
  • एएससी: =(F3-F4)*G3

फिर हम इन सूत्रों को कॉलम एफ, जी और एच में प्रत्येक सेल में कॉपी और पेस्ट करेंगे:

चरण 4: आरओसी वक्र बनाएं

आरओसी वक्र बनाने के लिए, हम F3:G14 श्रेणी में प्रत्येक मान को हाइलाइट करेंगे।

इसके बाद, हम शीर्ष रिबन के साथ सम्मिलित करें टैब पर क्लिक करेंगे, फिर निम्नलिखित पथ बनाने के लिए सम्मिलित स्कैटर (X, Y) पर क्लिक करेंगे:

एक्सेल में आरओसी वक्र

चरण 5: एयूसी की गणना करें

वक्र प्लॉट के ऊपरी बाएँ कोने के जितना करीब फिट होगा, मॉडल उतना ही बेहतर ढंग से डेटा को श्रेणियों में वर्गीकृत करने में सक्षम होगा।

जैसा कि हम ऊपर दिए गए ग्राफ़ से देख सकते हैं, यह लॉजिस्टिक रिग्रेशन मॉडल डेटा को श्रेणियों में वर्गीकृत करने का बहुत अच्छा काम करता है।

इसे मापने के लिए, हम एयूसी (वक्र के नीचे का क्षेत्र) की गणना कर सकते हैं जो हमें बताता है कि प्लॉट का कितना हिस्सा वक्र के नीचे है।

AUC 1 के जितना करीब होगा, मॉडल उतना ही बेहतर होगा। 0.5 के बराबर एयूसी वाला मॉडल यादृच्छिक वर्गीकरण करने वाले मॉडल से बेहतर नहीं है।

वक्र के AUC की गणना करने के लिए, हम कॉलम H में सभी मानों को आसानी से जोड़ सकते हैं:

एक्सेल में एयूसी की गणना करें

AUC 0.802662 निकला। यह मान काफी अधिक है, जो दर्शाता है कि मॉडल डेटा को “पास” और “फेल” श्रेणियों में वर्गीकृत करने का अच्छा काम करता है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि एक्सेल में अन्य सामान्य प्लॉट कैसे बनाएं:

एक्सेल में सीडीएफ कैसे प्लॉट करें
एक्सेल में सर्वाइवल कर्व कैसे बनाएं
एक्सेल में सांख्यिकीय प्रक्रिया नियंत्रण चार्ट कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *