एसएएस में आरएमएसई की गणना कैसे करें
यह मूल्यांकन करने का एक तरीका है कि एक प्रतिगमन मॉडल डेटा सेट में कितनी अच्छी तरह फिट बैठता है, माध्य वर्ग त्रुटि की गणना करना है, जो एक मीट्रिक है जो हमें मॉडल के अनुमानित मूल्यों और डेटासेट के वास्तविक मूल्यों के बीच औसत दूरी बताता है।
आरएमएसई जितना कम होगा, दिया गया मॉडल उतना ही बेहतर डेटा सेट को “फिट” करने में सक्षम होगा।
माध्य वर्ग त्रुटि, जिसे अक्सर संक्षिप्त रूप में RMSE कहा जाता है, ज्ञात करने का सूत्र है:
आरएमएसई = √ Σ(पी आई – ओ आई ) 2 / एन
सोना:
- Σ एक प्रतीक है जो “योग” का प्रतिनिधित्व करता है
- P i डेटासेट में iवें अवलोकन के लिए अनुमानित मान है
- O i डेटासेट में iवें अवलोकन के लिए मनाया गया मान है
- n नमूना आकार है
निम्नलिखित चरण-दर-चरण उदाहरण दिखाता है कि एसएएस में एक सरल रैखिक प्रतिगमन मॉडल के लिए आरएमएसई की गणना कैसे करें।
चरण 1: डेटा बनाएं
इस उदाहरण के लिए, हम एक डेटासेट बनाएंगे जिसमें अध्ययन किए गए घंटों की कुल संख्या और 15 छात्रों के अंतिम परीक्षा ग्रेड शामिल होंगे।
हम भविष्यवक्ता चर के रूप में घंटों और प्रतिक्रिया चर के रूप में स्कोर का उपयोग करके एक सरल रैखिक प्रतिगमन मॉडल फिट करेंगे।
निम्नलिखित कोड दिखाता है कि एसएएस में इस डेटासेट को कैसे बनाया जाए:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
चरण 2: सरल रैखिक प्रतिगमन मॉडल फिट करें
इसके बाद, हम सरल रैखिक प्रतिगमन मॉडल को फिट करने के लिए proc reg का उपयोग करेंगे:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
ध्यान दें कि आउटपुट में RMSE 3.64093 है।
चरण 3: प्रतिगमन मॉडल से आरएमएसई निकालें
यदि आप केवल इस मॉडल का आरएमएसई प्रदर्शित करना चाहते हैं और कोई अन्य आउटपुट परिणाम नहीं दिखाना चाहते हैं, तो आप निम्नलिखित कोड का उपयोग कर सकते हैं:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rmse ; run ; quit ; /*print RMSE of model*/ proc print data =outest; var _RMSE_; run ;
ध्यान दें कि आउटपुट में केवल 3.64093 का RMSE मान प्रदर्शित होता है।
ध्यान दें : proc reg में noprint तर्क SAS को संपूर्ण प्रतिगमन परिणाम आउटपुट को प्रिंट न करने के लिए कहता है जैसा कि उसने पिछले चरण में किया था।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि एसएएस में अन्य सामान्य कार्य कैसे करें:
एसएएस में सरल रैखिक प्रतिगमन कैसे करें
एसएएस में मल्टीपल लीनियर रिग्रेशन कैसे करें
एसएएस में बहुपद प्रतिगमन कैसे करें
एसएएस में लॉजिस्टिक रिग्रेशन कैसे करें