วิธีการพล็อตค่าที่ทำนายไว้ใน r (พร้อมตัวอย่าง)


บ่อยครั้งที่คุณอาจต้องการพล็อตค่าที่ทำนายของแบบจำลองการถดถอยใน R เพื่อให้เห็นภาพความแตกต่างระหว่างค่าที่ทำนายกับค่าจริง

บทช่วยสอนนี้ให้ตัวอย่างการสร้างพล็อตประเภทนี้ใน R และ ggplot2

ตัวอย่างที่ 1: การพล็อตค่าที่ทำนายและค่าจริงในฐาน R

รหัสต่อไปนี้แสดงวิธีการปรับ โมเดลการถดถอยเชิงเส้นหลายตัว ใน R จากนั้นสร้างพล็อตของค่าที่คาดการณ์และค่าจริง:

 #create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
plot(x=predict(model), y=df$y,
     xlab=' Predicted Values ',
     ylab=' Actual Values ',
     main=' Predicted vs. Actual Values ')

#add diagonal line for estimated regression line
abline(a= 0 , b= 1 )

การพล็อตค่าที่ทำนายไว้ใน R

แกน X จะแสดงค่าที่คาดการณ์จากแบบจำลอง และแกน Y จะแสดงค่าจริงจากชุดข้อมูล เส้นทแยงมุมตรงกลางกราฟคือเส้นถดถอยโดยประมาณ

เนื่องจากจุดข้อมูลแต่ละจุดค่อนข้างใกล้กับเส้นการถดถอยโดยประมาณ นี่จึงบอกเราว่าแบบจำลองการถดถอยทำงานได้ดีพอสมควรในการปรับข้อมูลให้เหมาะสม

นอกจากนี้เรายังสามารถสร้างกรอบข้อมูลที่แสดงค่าจริงและค่าที่คาดการณ์ไว้สำหรับแต่ละจุดข้อมูล:

 #create data frame of actual and predicted values
values <- data. frame (actual=df$y, predicted=predict(model))

#view data frame
values

   actual predicted
1 22 22.54878
2 24 23.56707
3 24 23.96341
4 25 24.98171
5 25 25.37805
6 27 26.79268
7 29 28.60366
8 31 30.41463
9 32 33.86585
10 36 34.88415

ตัวอย่างที่ 2: การพล็อตค่าที่คาดการณ์และค่าจริงใน ggplot2

รหัสต่อไปนี้แสดงวิธีสร้างพล็อตของค่าที่คาดการณ์และค่าจริงโดยใช้แพ็คเกจการแสดงข้อมูล ggplot2 :

 library (ggplot2) 

#create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
ggplot(df, aes (x=predict(model), y=y)) + 
  geom_point() +
  geom_abline(intercept= 0 , slope= 1 ) +
  labs(x=' Predicted Values ', y=' Actual Values ', title=' Predicted vs. Actual Values ')

อีกครั้ง แกน X จะแสดงค่าที่คาดการณ์จากแบบจำลอง และแกน Y จะแสดงค่าจริงจากชุดข้อมูล

แหล่งข้อมูลเพิ่มเติม

วิธีสร้างพล็อตที่เหลือใน R
วิธีสร้างฮิสโตแกรมของสารตกค้างใน R
วิธีการคำนวณปริมาณคงเหลือมาตรฐานใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *