كيفية العثور على معامل التحديد (r-squared) في r


معامل التحديد (يشار إليه عادة بـ R 2 ) هو نسبة تباين متغير الاستجابة الذي يمكن تفسيره بالمتغيرات التوضيحية في نموذج الانحدار.

يقدم هذا البرنامج التعليمي مثالاً لكيفية العثور على R2 وتفسيره في نموذج الانحدار في R.

ذات صلة: ما هي قيمة R-squared الجيدة؟

مثال: إيجاد وتفسير R-square في R

لنفترض أن لدينا مجموعة البيانات التالية التي تحتوي على بيانات حول عدد ساعات الدراسة، والامتحانات التحضيرية التي تم إجراؤها، ودرجات الامتحانات التي تم تلقيها لـ 15 طالبًا:

 #create data frame
df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3),
                 prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4),
                 score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82))

#view first six rows of data frame
head(df)

  hours prep_exams score
1 1 1 76
2 2 3 78
3 2 3 85
4 4 5 88
5 2 2 72
6 1 2 69

يوضح التعليمة البرمجية التالية كيفية ملاءمة نموذج الانحدار الخطي المتعدد لمجموعة البيانات هذه وعرض مخرجات النموذج في R:

 #fit regression model
model <- lm(score~hours+prep_exams, data=df)

#view model summary
summary(model)

Call:
lm(formula = score ~ hours + prep_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-7.9896 -2.5514 0.3079 3.3370 7.0352 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 71.8078 3.5222 20.387 1.12e-10 ***
hours 5.0247 0.8964 5.606 0.000115 ***
prep_exams -1.2975 0.9689 -1.339 0.205339    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.944 on 12 degrees of freedom
Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 
F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454

تبين أن مربع R للنموذج (الموضح في أسفل الناتج) هو 0.7237 .

وهذا يعني أن 72.37% من التباين في درجات الامتحانات يمكن تفسيره بعدد الساعات المدروسة وعدد الاختبارات التدريبية التي تم إجراؤها.

لاحظ أنه يمكنك أيضًا الوصول إلى هذه القيمة باستخدام بناء الجملة التالي:

 summary(model)$r.squared

[1] 0.7236545

كيفية تفسير قيمة R-squared

ستكون قيمة R التربيعية دائمًا بين 0 و1.

تشير القيمة 1 إلى أن المتغيرات التوضيحية يمكنها تفسير تباين متغير الاستجابة بشكل مثالي وتشير القيمة 0 إلى أن المتغيرات التوضيحية ليس لديها القدرة على تفسير تباين متغير الاستجابة.

بشكل عام، كلما زادت قيمة R-squared لنموذج الانحدار، كلما كانت المتغيرات التوضيحية قادرة على التنبؤ بقيمة متغير الاستجابة بشكل أفضل.

راجع هذه المقالة للحصول على مزيد من التفاصيل حول كيفية تحديد ما إذا كانت قيمة R-squared معينة تعتبر “جيدة” لنموذج انحدار معين أم لا.

ذات صلة: كيفية حساب R-squared المعدل في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *