एमएसई बनाम आरएमएसई: आपको किस मीट्रिक का उपयोग करना चाहिए?
प्रतिगमन मॉडल का उपयोग एक या अधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को मापने के लिए किया जाता है।
जब भी हम एक प्रतिगमन मॉडल को फिट करते हैं, तो हम यह समझना चाहते हैं कि मॉडल प्रतिक्रिया चर के मूल्य की भविष्यवाणी करने के लिए भविष्यवक्ता चर के मूल्यों का कितनी अच्छी तरह उपयोग करने में सक्षम है।
दो मीट्रिक जो हम अक्सर यह निर्धारित करने के लिए उपयोग करते हैं कि कोई मॉडल किसी डेटा सेट में कितनी अच्छी तरह फिट बैठता है, माध्य वर्ग त्रुटि (MSE) और मूल माध्य वर्ग त्रुटि (RMSE) हैं, जिनकी गणना निम्नानुसार की जाती है:
एमएसई : एक मीट्रिक जो हमें डेटा सेट में अनुमानित मूल्यों और वास्तविक मूल्यों के बीच मूल माध्य वर्ग अंतर बताता है। एमएसई जितना कम होगा, मॉडल डेटा सेट में उतना ही बेहतर फिट होगा।
एमएसई = Σ(ŷ i – y i ) 2 / n
सोना:
- Σ एक प्रतीक है जिसका अर्थ है “योग”
- ŷ i, i वें अवलोकन के लिए अनुमानित मान है
- y i, iवें अवलोकन के लिए प्रेक्षित मान है
- n नमूना आकार है
आरएमएसई : एक मीट्रिक जो हमें डेटा सेट में अनुमानित मूल्यों और वास्तविक मूल्यों के बीच मूल माध्य वर्ग अंतर का वर्गमूल बताता है। आरएमएसई जितना कम होगा, मॉडल डेटा सेट में उतना ही बेहतर फिट होगा।
इसकी गणना इस प्रकार की जाती है:
RMSE = √ Σ(ŷ i – y i ) 2 / n
सोना:
- Σ एक प्रतीक है जिसका अर्थ है “योग”
- ŷ i, i वें अवलोकन के लिए अनुमानित मान है
- y i, iवें अवलोकन के लिए प्रेक्षित मान है
- n नमूना आकार है
ध्यान दें कि सूत्र लगभग समान हैं। वास्तव में, माध्य वर्ग त्रुटि, माध्य वर्ग त्रुटि का वर्गमूल मात्र है।
आरएमएसई बनाम एमएसई: आपको किस मीट्रिक का उपयोग करना चाहिए?
यह मूल्यांकन करने के लिए कि कोई मॉडल डेटा सेट में कितनी अच्छी तरह फिट बैठता है, हम अक्सर आरएमएसई का उपयोग करते हैं क्योंकि इसे प्रतिक्रिया चर के समान इकाइयों में मापा जाता है।
इसके विपरीत, एमएसई को प्रतिक्रिया चर की वर्ग इकाइयों में मापा जाता है।
इसे स्पष्ट करने के लिए, मान लीजिए कि हम एक प्रतिगमन मॉडल का उपयोग करके यह अनुमान लगाते हैं कि बास्केटबॉल खेल में 10 खिलाड़ी कितने अंक अर्जित करेंगे।
निम्न तालिका खिलाड़ियों द्वारा प्राप्त वास्तविक अंकों की तुलना में मॉडल द्वारा अनुमानित अंकों को दर्शाती है:
हम माध्य वर्ग त्रुटि (MSE) की गणना इस प्रकार करेंगे:
- एमएसई = Σ(ŷ i – y i ) 2 / n
- एमएसई = ((14-12) 2 +(15-15) 2 +(18-20) 2 +(19-16) 2 +(25-20) 2 +(18-19) 2 +(12-16) 2 +(12-20) 2 +(15-16) 2 +(22-16) 2 ) / 10
- एमएसई = 16
मूल माध्य वर्ग त्रुटि 16 है। यह हमें बताता है कि मॉडल द्वारा अनुमानित मानों और वास्तविक मानों के बीच मूल माध्य वर्ग अंतर 16 है।
मूल माध्य वर्ग त्रुटि (RMSE) केवल MSE का वर्गमूल होगी:
- एडीई = √ ईक्यूएम
- आरएमएसई = √ 16
- आरएमएसई = 4
माध्य वर्ग त्रुटि 4 है। यह हमें बताता है कि अनुमानित अंक और प्राप्त वास्तविक अंक के बीच औसत विचलन 4 है।
ध्यान दें कि माध्य वर्ग त्रुटि की व्याख्या करना माध्य वर्ग त्रुटि की तुलना में बहुत सरल है, क्योंकि हम “वर्ग बनाए गए अंक” के विपरीत “स्कोर किए गए अंक” के बारे में बात कर रहे हैं।
व्यवहार में आरएमएसई का उपयोग कैसे करें
व्यवहार में, हम आम तौर पर एक डेटासेट में एकाधिक प्रतिगमन मॉडल फिट करते हैं और प्रत्येक मॉडल की मूल माध्य वर्ग त्रुटि (आरएमएसई) की गणना करते हैं।
फिर हम सबसे कम आरएमएसई मान वाले मॉडल को “सर्वश्रेष्ठ” मॉडल के रूप में चुनते हैं, क्योंकि यह वह है जो भविष्यवाणियों को डेटासेट में वास्तविक मूल्यों के सबसे करीब बनाता है।
ध्यान दें कि हम प्रत्येक मॉडल के एमएसई मूल्यों की तुलना भी कर सकते हैं, लेकिन आरएमएसई की व्याख्या करना आसान है और इसलिए इसका उपयोग अधिक बार किया जाता है।
अतिरिक्त संसाधन
एकाधिक रेखीय प्रतिगमन का परिचय
आरएमएसई बनाम आर-स्क्वेर्ड: आपको किस मीट्रिक का उपयोग करना चाहिए?
आरएमएसई कैलकुलेटर