كيفية رسم القيم المتوقعة في لغة r (مع أمثلة)


في كثير من الأحيان قد ترغب في رسم القيم المتوقعة لنموذج الانحدار في R من أجل تصور الاختلافات بين القيم المتوقعة والقيم الفعلية.

يقدم هذا البرنامج التعليمي أمثلة لإنشاء هذا النوع من المخططات في R وggplot2.

مثال 1: رسم القيم المتوقعة والفعلية في الأساس R

يوضح التعليمة البرمجية التالية كيفية ملاءمة نموذج الانحدار الخطي المتعدد في R ثم إنشاء مخطط للقيم المتوقعة والفعلية:

 #create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
plot(x=predict(model), y=df$y,
     xlab=' Predicted Values ',
     ylab=' Actual Values ',
     main=' Predicted vs. Actual Values ')

#add diagonal line for estimated regression line
abline(a= 0 , b= 1 )

رسم القيم المتوقعة في R

يعرض المحور X القيم المتوقعة من النموذج ويعرض المحور Y القيم الفعلية من مجموعة البيانات. الخط القطري في منتصف الرسم البياني هو خط الانحدار المقدر.

وبما أن كل نقطة من نقاط البيانات تقع بالقرب إلى حد ما من خط الانحدار المقدر، فإن هذا يخبرنا أن نموذج الانحدار يقوم بعمل جيد إلى حد ما في ملاءمة البيانات.

يمكننا أيضًا إنشاء إطار بيانات يعرض القيم الفعلية والمتوقعة لكل نقطة بيانات:

 #create data frame of actual and predicted values
values <- data. frame (actual=df$y, predicted=predict(model))

#view data frame
values

   actual predicted
1 22 22.54878
2 24 23.56707
3 24 23.96341
4 25 24.98171
5 25 25.37805
6 27 26.79268
7 29 28.60366
8 31 30.41463
9 32 33.86585
10 36 34.88415

المثال 2: رسم القيم المتوقعة والفعلية في ggplot2

يوضح الكود التالي كيفية إنشاء مخطط للقيم المتوقعة والفعلية باستخدام حزمة تصور البيانات ggplot2 :

 library (ggplot2) 

#create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
ggplot(df, aes (x=predict(model), y=y)) + 
  geom_point() +
  geom_abline(intercept= 0 , slope= 1 ) +
  labs(x=' Predicted Values ', y=' Actual Values ', title=' Predicted vs. Actual Values ')

مرة أخرى، يعرض المحور X القيم المتوقعة من النموذج ويعرض المحور Y القيم الفعلية من مجموعة البيانات.

مصادر إضافية

كيفية إنشاء قطعة أرض متبقية في R
كيفية إنشاء رسم بياني للبقايا في R
كيفية حساب المخلفات الموحدة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *