पायथन में f1 स्कोर की गणना कैसे करें (उदाहरण सहित)
मशीन लर्निंग में वर्गीकरण मॉडल का उपयोग करते समय, मॉडल की गुणवत्ता का मूल्यांकन करने के लिए हम जिस सामान्य मीट्रिक का उपयोग करते हैं वह F1 स्कोर है।
इस मीट्रिक की गणना इस प्रकार की जाती है:
एफ1 स्कोर = 2 * (प्रिसिजन * रिकॉल) / (प्रिसिजन + रिकॉल)
सोना:
- सटीकता : कुल सकारात्मक भविष्यवाणियों के सापेक्ष सकारात्मक भविष्यवाणियों को सही करें
- अनुस्मारक : कुल वास्तविक सकारात्मकताओं के विरुद्ध सकारात्मक भविष्यवाणियों को सही करना
उदाहरण के लिए, मान लीजिए कि हम यह अनुमान लगाने के लिए एक लॉजिस्टिक रिग्रेशन मॉडल का उपयोग करते हैं कि 400 अलग-अलग कॉलेज बास्केटबॉल खिलाड़ियों को एनबीए में शामिल किया जाएगा या नहीं।
निम्नलिखित भ्रम मैट्रिक्स मॉडल द्वारा की गई भविष्यवाणियों का सारांश प्रस्तुत करता है:
यहां मॉडल के F1 स्कोर की गणना करने का तरीका बताया गया है:
सटीकता = सच्चा सकारात्मक / (सच्चा सकारात्मक + गलत सकारात्मक) = 120/ (120+70) = 0.63157
स्मरण = सच्चा सकारात्मक / (सच्चा सकारात्मक + गलत नकारात्मक) = 120 / (120+40) = 0.75
एफ1 स्कोर = 2 * (.63157 * .75) / (.63157 + .75) = . 6857
निम्नलिखित उदाहरण दिखाता है कि पायथन में इस सटीक मॉडल के लिए F1 स्कोर की गणना कैसे करें।
उदाहरण: पायथन में F1 स्कोर की गणना
निम्नलिखित कोड दिखाता है कि अनुमानित मानों और वास्तविक मानों की दी गई सरणी के लिए F1 स्कोर की गणना करने के लिए पायथन में स्केलेर पैकेज के f1_score() फ़ंक्शन का उपयोग कैसे करें।
import numpy as np from sklearn. metrics import f1_score #define array of actual classes actual = np. repeat ([1, 0], repeats=[160, 240]) #define array of predicted classes pred = np. repeat ([1, 0, 1, 0], repeats=[120, 40, 70, 170]) #calculate F1 score f1_score(actual, pred) 0.6857142857142857
हम देखते हैं कि F1 स्कोर 0.6857 है। यह उस मूल्य से मेल खाता है जिसकी हमने पहले मैन्युअल रूप से गणना की थी।
नोट : आप f1_score() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ यहां पा सकते हैं।
F1 स्कोर का उपयोग करने पर नोट्स
यदि आप कई मॉडलों की तुलना करने के लिए F1 स्कोर का उपयोग करते हैं, तो उच्चतम F1 स्कोर वाला मॉडल उस मॉडल का प्रतिनिधित्व करता है जो टिप्पणियों को कक्षाओं में वर्गीकृत करने में सबसे अच्छा सक्षम है।
उदाहरण के लिए, यदि आप किसी अन्य लॉजिस्टिक रिग्रेशन मॉडल को डेटा में फिट करते हैं और उस मॉडल का F1 स्कोर 0.75 है, तो उस मॉडल को बेहतर माना जाएगा क्योंकि उसका F1 स्कोर अधिक है।
अतिरिक्त संसाधन
पायथन में लॉजिस्टिक रिग्रेशन कैसे करें
पायथन में कन्फ्यूजन मैट्रिक्स कैसे बनाएं
पायथन में संतुलित परिशुद्धता की गणना कैसे करें
F1 स्कोर बनाम सटीकता: आपको किसका उपयोग करना चाहिए?