كيفية رسم نتائج الانحدار الخطي المتعددة في r
عندما نقوم بإجراء انحدار خطي بسيط في R، فمن السهل تصور خط الانحدار المناسب لأننا نعمل فقط مع متغير توقع واحد ومتغير استجابة واحد.
على سبيل المثال، يوضح التعليمة البرمجية التالية كيفية ملاءمة نموذج الانحدار الخطي البسيط لمجموعة بيانات ورسم النتائج:
#create dataset data <- data.frame(x = c(1, 1, 2, 4, 4, 5, 6, 7, 7, 8, 9, 10, 11, 11), y = c(13, 14, 17, 23, 24, 25, 25, 24, 28, 32, 33, 35, 40, 41)) #fit simple linear regression model model <- lm(y ~ x, data = data) #create scatterplot of data plot(data$x, data$y) #add fitted regression line abline(model)
ومع ذلك، عندما نقوم بإجراء انحدار خطي متعدد، يصبح من الصعب تصور النتائج نظرًا لوجود متغيرات تنبؤية متعددة ولا يمكننا ببساطة رسم خط انحدار على رسم بياني ثنائي الأبعاد.
بدلاً من ذلك، يمكننا استخدام مخططات متغيرة مضافة (تسمى أحيانًا “مخططات الانحدار الجزئي”)، وهي مخططات فردية تعرض العلاقة بين متغير الاستجابة ومتغير متنبئ، مع التحكم في وجود متغيرات تنبؤية أخرى في النموذج .
يوضح المثال التالي كيفية إجراء الانحدار الخطي المتعدد في R وتصور النتائج باستخدام مخططات متغيرة ملحقة.
مثال: رسم نتائج الانحدار الخطي المتعدد في R
لنفترض أننا نلائم نموذج الانحدار الخطي المتعدد التالي لمجموعة بيانات في R باستخدام مجموعة بيانات mtcars المضمنة:
#fit multiple linear regression model
model <- lm(mpg ~ disp + hp + drat, data = mtcars)
#view results of model
summary(model)
Call:
lm(formula = mpg ~ disp + hp + drat, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-5.1225 -1.8454 -0.4456 1.1342 6.4958
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.344293 6.370882 3.036 0.00513 **
available -0.019232 0.009371 -2.052 0.04960 *
hp -0.031229 0.013345 -2.340 0.02663 *
drat 2.714975 1.487366 1.825 0.07863 .
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.008 on 28 degrees of freedom
Multiple R-squared: 0.775, Adjusted R-squared: 0.7509
F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
ومن النتائج يمكننا أن نرى أن القيمة الاحتمالية لكل من المعاملات أقل من 0.1. من أجل التبسيط، سنفترض أن كل متغير من المتغيرات المتوقعة مهم ويجب تضمينه في النموذج.
لإنتاج مخططات للمتغيرات الملحقة، يمكننا استخدام الدالة avPlots() من الحزمة car :
#load car package
library(car)
#produce added variable plots
avPlots(model)
وإليك كيفية تفسير كل مؤامرة:
- يعرض المحور السيني متغيرًا متوقعًا واحدًا ويعرض المحور الصادي متغير الاستجابة.
- يوضح الخط الأزرق الارتباط بين متغير التوقع ومتغير الاستجابة، مع الحفاظ على قيمة جميع متغيرات التوقع الأخرى ثابتة .
- تمثل النقاط المحددة في كل رسم بياني الملاحظتين اللتين تحتويان على أكبر القيم المتبقية والملاحظتين اللتين تتمتعان بأكبر رافعة جزئية.
لاحظ أن زاوية الخط في كل مخطط تتوافق مع إشارة معامل معادلة الانحدار المقدرة.
على سبيل المثال، فيما يلي المعاملات المقدرة لكل متغير متنبئ في النموذج:
- العرض: -0.019232
- الفصل: -0.031229
- التاريخ: 2.714975
لاحظ أن زاوية الخط موجبة في المخطط المتغير المضاف لـ drt بينما تكون سالبة لـ disp و hp ، وهو ما يتوافق مع إشارات معاملاتهما المقدرة:
على الرغم من أننا لا نستطيع رسم خط انحدار واحد مناسب على رسم بياني ثنائي الأبعاد نظرًا لأن لدينا متغيرات تنبؤية متعددة، فإن هذه الرسوم البيانية المتغيرة المضافة تسمح لنا بمراقبة العلاقة بين كل متغير متنبئ فردي ومتغير الاستجابة مع الحفاظ على ثبات المتغيرات التنبؤية الأخرى.