كيفية حساب الخطأ المعياري المتبقي في r


عندما نلائم نموذج الانحدار الخطي في R، يأخذ النموذج النموذج التالي:

Y = β 0 + β 1 X + … + β i

حيث ϵ هو مصطلح خطأ مستقل عن X.

بغض النظر عن كيفية استخدام X للتنبؤ بقيم Y، سيكون هناك دائمًا خطأ عشوائي في النموذج. إحدى طرق قياس تشتت هذا الخطأ العشوائي هي استخدام الخطأ المعياري المتبقي ، وهي طريقة لقياس الانحراف المعياري للبقايا ϵ.

يتم حساب الخطأ المعياري المتبقي لنموذج الانحدار على النحو التالي:

الخطأ المعياري المتبقي = √ بقايا SS / بقايا df

ذهب:

  • Residuals SS : مجموع المربعات المتبقية.
  • residual df : درجات الحرية المتبقية، محسوبة كـ n – k – 1 حيث n = إجمالي عدد الملاحظات و k = إجمالي عدد معلمات النموذج.

هناك ثلاث طرق يمكننا استخدامها لحساب الخطأ المعياري المتبقي لنموذج الانحدار في R.

الطريقة الأولى: تحليل ملخص النموذج

الطريقة الأولى للحصول على الخطأ القياسي المتبقي هي ببساطة ملاءمة نموذج الانحدار الخطي ثم استخدام الأمر Summary() للحصول على نتائج النموذج. ثم ابحث فقط عن “الخطأ القياسي المتبقي” في أسفل الإخراج:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

يمكننا أن نرى أن الخطأ المعياري المتبقي هو 3.127 .

الطريقة الثانية: استخدم صيغة بسيطة

هناك طريقة أخرى للحصول على الخطأ المعياري المتبقي (RSE) وهي ملاءمة نموذج الانحدار الخطي ثم استخدام الصيغة التالية لحساب RSE:

 sqrt( deviance (model)/df. residual (model))

إليك كيفية تنفيذ هذه الصيغة في R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

يمكننا أن نرى أن الخطأ القياسي المتبقي هو 3.126601 .

الطريقة الثالثة: استخدم صيغة خطوة بخطوة

هناك طريقة أخرى للحصول على الخطأ المعياري المتبقي وهي ملاءمة نموذج الانحدار الخطي ثم استخدام نهج خطوة بخطوة لحساب كل مكون فردي من معادلة RSE:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

يمكننا أن نرى أن الخطأ القياسي المتبقي هو 3.126601 .

كيفية تفسير الخطأ المعياري المتبقي

كما ذكرنا سابقًا، فإن الخطأ المعياري المتبقي (RSE) هو وسيلة لقياس الانحراف المعياري للبقايا في نموذج الانحدار.

كلما انخفضت قيمة المسؤولية الاجتماعية للشركات، كانت قدرة النموذج على ملاءمة البيانات أفضل (ولكن كن حذرًا من التجاوز ). يمكن أن يكون هذا مقياسًا مفيدًا لاستخدامه عند مقارنة نموذجين أو أكثر لتحديد النموذج الذي يناسب البيانات بشكل أفضل.

مصادر إضافية

كيفية تفسير الخطأ المعياري المتبقي
كيفية إجراء الانحدار الخطي المتعدد في R
كيفية التحقق من صحة أداء النموذج في R
كيفية حساب الانحراف المعياري في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *