संतुलित सटीकता क्या है? (परिभाषा & #038; उदाहरण)


संतुलित सटीकता एक मीट्रिक है जिसका उपयोग हम वर्गीकरण मॉडल के प्रदर्शन का मूल्यांकन करने के लिए कर सकते हैं।

इसकी गणना इस प्रकार की जाती है:

संतुलित सटीकता = (संवेदनशीलता + विशिष्टता) / 2

सोना:

  • संवेदनशीलता : “सच्ची सकारात्मक दर” – सकारात्मक मामलों का प्रतिशत जो मॉडल पता लगाने में सक्षम है।
  • विशिष्टता : “सच्ची नकारात्मक दर” – नकारात्मक मामलों का प्रतिशत जो मॉडल पता लगाने में सक्षम है।

यह मीट्रिक विशेष रूप से तब उपयोगी होती है जब दो वर्ग असंतुलित होते हैं, अर्थात, एक वर्ग दूसरे की तुलना में बहुत अधिक दिखाई देता है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में संतुलित सटीकता की गणना कैसे की जाती है और यह दर्शाता है कि यह इतनी उपयोगी मीट्रिक क्यों है।

उदाहरण: संतुलित परिशुद्धता की गणना

मान लीजिए कि एक खेल विश्लेषक यह अनुमान लगाने के लिए एक लॉजिस्टिक रिग्रेशन मॉडल का उपयोग करता है कि 400 अलग-अलग कॉलेज बास्केटबॉल खिलाड़ियों को एनबीए में शामिल किया जाएगा या नहीं।

निम्नलिखित भ्रम मैट्रिक्स मॉडल द्वारा की गई भविष्यवाणियों का सारांश प्रस्तुत करता है:

मॉडल की संतुलित सटीकता की गणना करने के लिए, हम पहले संवेदनशीलता और विशिष्टता की गणना करेंगे:

  • संवेदनशीलता : “सच्ची सकारात्मक दर” = 15 / (15 + 5) = 0.75
  • विशिष्टता : “सच्ची नकारात्मक दर” = 375 / (375 + 5) = 0.9868

फिर हम संतुलित परिशुद्धता की गणना इस प्रकार कर सकते हैं:

  • संतुलित सटीकता = (संवेदनशीलता + विशिष्टता) / 2
  • संतुलित सटीकता = (0.75 + 9868)/2
  • संतुलित सटीकता = 0.8684

मॉडल की संतुलित सटीकता 0.8684 निकली।

ध्यान दें कि संतुलित परिशुद्धता 1 के जितनी करीब होगी, मॉडल उतना ही अधिक अवलोकनों को सही ढंग से वर्गीकृत करने में सक्षम होगा।

इस उदाहरण में, संतुलित सटीकता काफी अधिक है, जो हमें बताती है कि लॉजिस्टिक रिग्रेशन मॉडल यह भविष्यवाणी करने का बहुत अच्छा काम कर रहा है कि कॉलेज के खिलाड़ियों को एनबीए में शामिल किया जाएगा या नहीं।

इस परिदृश्य में, चूंकि कक्षाएं बहुत असंतुलित हैं (20 खिलाड़ियों को ड्राफ्ट किया गया था और 380 खिलाड़ियों को नहीं चुना गया था), संतुलित सटीकता हमें समग्र सटीकता माप की तुलना में मॉडल प्रदर्शन की अधिक यथार्थवादी तस्वीर देती है।

उदाहरण के लिए, हम मॉडल सटीकता की गणना इस प्रकार करेंगे:

  • सटीकता = (टीपी + टीएन) / (टीपी + टीएन + एफपी + एफएन)
  • सटीकता = (15 + 375) / (15 + 375 + 5 + 5)
  • सटीकता = 0.975

मॉडल की सटीकता 0.975 है, जो बहुत अधिक लगती है।

हालाँकि, एक ऐसे मॉडल पर विचार करें जो केवल यह भविष्यवाणी करता है कि प्रत्येक खिलाड़ी बिना ड्राफ्ट के चुना जाएगा। इसकी सटीकता 380/400 = 0.95 होगी। यह हमारे मॉडल की सटीकता से थोड़ा ही कम है।

0.8684 का संतुलित सटीकता स्कोर हमें दोनों वर्गों की भविष्यवाणी करने की मॉडल की क्षमता का बेहतर विचार देता है।

दूसरे शब्दों में, यह हमें मॉडल की भविष्यवाणी करने की क्षमता का बेहतर विचार देता है कि कौन से खिलाड़ी बिना ड्राफ्ट के जाएंगे और कौन से।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि विभिन्न सांख्यिकीय सॉफ़्टवेयर में भ्रम मैट्रिक्स कैसे बनाया जाए:

एक्सेल में कन्फ्यूजन मैट्रिक्स कैसे बनाएं
आर में कन्फ्यूजन मैट्रिक्स कैसे बनाएं
पायथन में कन्फ्यूजन मैट्रिक्स कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *