आर में अवशिष्ट मानक त्रुटि की गणना कैसे करें


जब भी हम R में एक रेखीय प्रतिगमन मॉडल फिट करते हैं, तो मॉडल निम्नलिखित रूप लेता है:

Y = β 0 + β 1 X + … + β i

जहां ϵ X से स्वतंत्र एक त्रुटि पद है।

इससे कोई फर्क नहीं पड़ता कि Y के मूल्यों की भविष्यवाणी करने के लिए X का उपयोग कैसे किया जा सकता है, मॉडल में हमेशा यादृच्छिक त्रुटि होगी। इस यादृच्छिक त्रुटि के फैलाव को मापने का एक तरीका अवशिष्ट मानक त्रुटि का उपयोग करना है, जो अवशिष्ट ϵ के मानक विचलन को मापने का एक तरीका है।

प्रतिगमन मॉडल की अवशिष्ट मानक त्रुटि की गणना निम्नानुसार की जाती है:

अवशिष्ट मानक त्रुटि = √ एसएस अवशेष / डीएफ अवशेष

सोना:

  • अवशिष्ट एसएस : वर्गों का अवशिष्ट योग।
  • अवशिष्ट डीएफ : स्वतंत्रता की अवशिष्ट डिग्री, एन – के – 1 के रूप में गणना की जाती है जहां एन = अवलोकनों की कुल संख्या और के = मॉडल मापदंडों की कुल संख्या।

आर में एक प्रतिगमन मॉडल की अवशिष्ट मानक त्रुटि की गणना करने के लिए हम तीन तरीकों का उपयोग कर सकते हैं।

विधि 1: मॉडल सारांश का विश्लेषण करें

अवशिष्ट मानक त्रुटि प्राप्त करने का पहला तरीका बस एक रैखिक प्रतिगमन मॉडल को फिट करना है और फिर मॉडल परिणाम प्राप्त करने के लिए सारांश() कमांड का उपयोग करना है। फिर आउटपुट के नीचे “अवशिष्ट मानक त्रुटि” देखें:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

हम देख सकते हैं कि अवशिष्ट मानक त्रुटि 3.127 है।

विधि 2: एक सरल सूत्र का प्रयोग करें

अवशिष्ट मानक त्रुटि (आरएसई) प्राप्त करने का दूसरा तरीका एक रैखिक प्रतिगमन मॉडल को फिट करना है और फिर आरएसई की गणना करने के लिए निम्नलिखित सूत्र का उपयोग करना है:

 sqrt( deviance (model)/df. residual (model))

इस फ़ॉर्मूले को R में लागू करने का तरीका यहां बताया गया है:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

हम देख सकते हैं कि अवशिष्ट मानक त्रुटि 3.126601 है।

विधि 3: चरण-दर-चरण सूत्र का उपयोग करें

अवशिष्ट मानक त्रुटि प्राप्त करने का दूसरा तरीका एक रैखिक प्रतिगमन मॉडल को फिट करना है और फिर आरएसई सूत्र के प्रत्येक व्यक्तिगत घटक की गणना करने के लिए चरण-दर-चरण दृष्टिकोण का उपयोग करना है:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

हम देख सकते हैं कि अवशिष्ट मानक त्रुटि 3.126601 है।

अवशिष्ट मानक त्रुटि की व्याख्या कैसे करें

जैसा कि पहले उल्लेख किया गया है, अवशिष्ट मानक त्रुटि (आरएसई) एक प्रतिगमन मॉडल में अवशेषों के मानक विचलन को मापने का एक तरीका है।

सीएसआर मूल्य जितना कम होगा, मॉडल उतना ही बेहतर डेटा को फिट करने में सक्षम होगा (लेकिन ओवरफिटिंग से सावधान रहें)। यह दो या दो से अधिक मॉडलों की तुलना करते समय उपयोग करने के लिए एक उपयोगी मीट्रिक हो सकता है ताकि यह निर्धारित किया जा सके कि कौन सा मॉडल डेटा के लिए सबसे उपयुक्त है।

अतिरिक्त संसाधन

अवशिष्ट मानक त्रुटि की व्याख्या कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
आर में मॉडल प्रदर्शन के लिए क्रॉस-वैलिडेशन कैसे करें
आर में मानक विचलन की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *