आर में अवशिष्ट मानक त्रुटि की गणना कैसे करें
जब भी हम R में एक रेखीय प्रतिगमन मॉडल फिट करते हैं, तो मॉडल निम्नलिखित रूप लेता है:
Y = β 0 + β 1 X + … + β i
जहां ϵ X से स्वतंत्र एक त्रुटि पद है।
इससे कोई फर्क नहीं पड़ता कि Y के मूल्यों की भविष्यवाणी करने के लिए X का उपयोग कैसे किया जा सकता है, मॉडल में हमेशा यादृच्छिक त्रुटि होगी। इस यादृच्छिक त्रुटि के फैलाव को मापने का एक तरीका अवशिष्ट मानक त्रुटि का उपयोग करना है, जो अवशिष्ट ϵ के मानक विचलन को मापने का एक तरीका है।
प्रतिगमन मॉडल की अवशिष्ट मानक त्रुटि की गणना निम्नानुसार की जाती है:
अवशिष्ट मानक त्रुटि = √ एसएस अवशेष / डीएफ अवशेष
सोना:
- अवशिष्ट एसएस : वर्गों का अवशिष्ट योग।
- अवशिष्ट डीएफ : स्वतंत्रता की अवशिष्ट डिग्री, एन – के – 1 के रूप में गणना की जाती है जहां एन = अवलोकनों की कुल संख्या और के = मॉडल मापदंडों की कुल संख्या।
आर में एक प्रतिगमन मॉडल की अवशिष्ट मानक त्रुटि की गणना करने के लिए हम तीन तरीकों का उपयोग कर सकते हैं।
विधि 1: मॉडल सारांश का विश्लेषण करें
अवशिष्ट मानक त्रुटि प्राप्त करने का पहला तरीका बस एक रैखिक प्रतिगमन मॉडल को फिट करना है और फिर मॉडल परिणाम प्राप्त करने के लिए सारांश() कमांड का उपयोग करना है। फिर आउटपुट के नीचे “अवशिष्ट मानक त्रुटि” देखें:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
हम देख सकते हैं कि अवशिष्ट मानक त्रुटि 3.127 है।
विधि 2: एक सरल सूत्र का प्रयोग करें
अवशिष्ट मानक त्रुटि (आरएसई) प्राप्त करने का दूसरा तरीका एक रैखिक प्रतिगमन मॉडल को फिट करना है और फिर आरएसई की गणना करने के लिए निम्नलिखित सूत्र का उपयोग करना है:
sqrt( deviance (model)/df. residual (model))
इस फ़ॉर्मूले को R में लागू करने का तरीका यहां बताया गया है:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
हम देख सकते हैं कि अवशिष्ट मानक त्रुटि 3.126601 है।
विधि 3: चरण-दर-चरण सूत्र का उपयोग करें
अवशिष्ट मानक त्रुटि प्राप्त करने का दूसरा तरीका एक रैखिक प्रतिगमन मॉडल को फिट करना है और फिर आरएसई सूत्र के प्रत्येक व्यक्तिगत घटक की गणना करने के लिए चरण-दर-चरण दृष्टिकोण का उपयोग करना है:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
हम देख सकते हैं कि अवशिष्ट मानक त्रुटि 3.126601 है।
अवशिष्ट मानक त्रुटि की व्याख्या कैसे करें
जैसा कि पहले उल्लेख किया गया है, अवशिष्ट मानक त्रुटि (आरएसई) एक प्रतिगमन मॉडल में अवशेषों के मानक विचलन को मापने का एक तरीका है।
सीएसआर मूल्य जितना कम होगा, मॉडल उतना ही बेहतर डेटा को फिट करने में सक्षम होगा (लेकिन ओवरफिटिंग से सावधान रहें)। यह दो या दो से अधिक मॉडलों की तुलना करते समय उपयोग करने के लिए एक उपयोगी मीट्रिक हो सकता है ताकि यह निर्धारित किया जा सके कि कौन सा मॉडल डेटा के लिए सबसे उपयुक्त है।
अतिरिक्त संसाधन
अवशिष्ट मानक त्रुटि की व्याख्या कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
आर में मॉडल प्रदर्शन के लिए क्रॉस-वैलिडेशन कैसे करें
आर में मानक विचलन की गणना कैसे करें