วิธีแยก rmse จากฟังก์ชัน lm() ใน r
คุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อแยกค่า Root Mean Square Error (RMSE) ของฟังก์ชัน lm() ใน R:
sqrt(mean(model$residuals^2))
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ที่เกี่ยวข้อง: วิธีตีความข้อผิดพลาด Root Mean Square Error (RMSE)
ตัวอย่าง: แยก RMSE จาก lm() ใน R
สมมติว่าเราใส่โมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้ใน R:
#create data frame df <- data. frame (rating=c(67, 75, 79, 85, 90, 96, 97), points=c(8, 12, 16, 15, 22, 28, 24), assists=c(4, 6, 6, 5, 3, 8, 7), rebounds=c(1, 4, 3, 3, 2, 6, 7)) #fit multiple linear regression model model <- lm(rating ~ points + assists + rebounds, data=df)
เราสามารถใช้ฟังก์ชัน summary() เพื่อแสดงข้อมูลสรุปแบบเต็มของโมเดลการถดถอย:
#view model summary
summary(model)
Call:
lm(formula = rating ~ points + assists + rebounds, data = df)
Residuals:
1 2 3 4 5 6 7
-1.5902 -1.7181 0.2413 4.8597 -1.0201 -0.6082 -0.1644
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 66.4355 6.6932 9.926 0.00218 **
points 1.2152 0.2788 4.359 0.02232 *
assists -2.5968 1.6263 -1.597 0.20860
rebounds 2.8202 1.6118 1.750 0.17847
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.193 on 3 degrees of freedom
Multiple R-squared: 0.9589, Adjusted R-squared: 0.9179
F-statistic: 23.35 on 3 and 3 DF, p-value: 0.01396
หากต้องการแยกเฉพาะข้อผิดพลาดรูตค่าเฉลี่ยกำลังสอง (RMSE) ของโมเดล เราสามารถใช้ไวยากรณ์ต่อไปนี้:
#extract RMSE of regression model
sqrt(mean(model$residuals^2))
[1] 2.090564
RMSE ของโมเดลคือ 2.090564
นี่แสดงถึงระยะห่างเฉลี่ยระหว่างค่าที่คาดการณ์ของแบบจำลองและค่าจริงของชุดข้อมูล
โปรดทราบว่ายิ่ง RMSE ต่ำ โมเดลที่กำหนดก็จะยิ่งสามารถ “พอดี” ชุดข้อมูลได้ดีขึ้นเท่านั้น
เมื่อเปรียบเทียบแบบจำลองการถดถอยต่างๆ แบบจำลองที่มี RMSE ต่ำที่สุดจะถือว่าเป็นแบบจำลองที่ “เหมาะสม” กับชุดข้อมูลมากที่สุด
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีสร้างพล็อตที่เหลือใน R