วิธีการคำนวณ rmse ใน r
ค่า คลาดเคลื่อนกำลังสองเฉลี่ยรูต (RMSE) เป็นตัววัดที่บอกเราว่าค่าที่คาดการณ์ของเรานั้นอยู่ห่างจากค่าที่สังเกตได้ในการวิเคราะห์การถดถอยโดยเฉลี่ยเท่าใด มีการคำนวณดังนี้:
RMSE = √[ Σ(P ผม – O ผม ) 2 / n ]
ทอง:
- Σ เป็นสัญลักษณ์แฟนซีที่หมายถึง “ผลรวม”
- P i คือค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ 3 ในชุดข้อมูล
- O i คือค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3 ในชุดข้อมูล
- n คือขนาดตัวอย่าง
บทช่วยสอนนี้จะอธิบายสองวิธีที่คุณสามารถใช้คำนวณ RMSE ใน R
วิธีที่ 1: เขียนฟังก์ชันของคุณเอง
สมมติว่าเรามีชุดข้อมูลที่มีคอลัมน์ที่มีค่าข้อมูลจริงและคอลัมน์ที่มีค่าข้อมูลที่คาดการณ์ไว้:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
ในการคำนวณ RMSE เราสามารถใช้ฟังก์ชันต่อไปนี้:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
ค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ 2.43242
วิธีที่ 2: ใช้แพ็คเกจ
นอกจากนี้เรายังสามารถคำนวณ RMSE สำหรับชุดข้อมูลเดียวกันได้โดยใช้ฟังก์ชัน rmse() จากแพ็คเกจ Metrics ซึ่งใช้ไวยากรณ์ต่อไปนี้:
rmse (จริง, วางแผนไว้)
ทอง:
- จริง: คุณค่าที่แท้จริง
- ทำนาย: ค่าที่ทำนาย
นี่คือไวยากรณ์ที่เราจะใช้ในตัวอย่างของเรา:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
ค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ 2.43242 ซึ่งตรงกับที่เราคำนวณไว้ก่อนหน้านี้โดยใช้ฟังก์ชันของเราเอง
วิธีการตีความ RMSE
RMSE เป็นวิธีที่มีประโยชน์ในการดูว่าแบบจำลองการถดถอยสามารถใส่ชุดข้อมูลได้ดีเพียงใด
ยิ่ง RMSE มีขนาดใหญ่เท่าใด ความแตกต่างระหว่างค่าที่คาดการณ์กับค่าที่สังเกตได้ก็จะยิ่งมากขึ้น ซึ่งหมายความว่าโมเดลการถดถอยจะเข้ากับข้อมูลได้แย่ลง ในทางกลับกัน ยิ่ง RMSE มีขนาดเล็ก โมเดลก็ยิ่งสามารถใส่ข้อมูลได้ดีขึ้นเท่านั้น
อาจมีประโยชน์อย่างยิ่งในการเปรียบเทียบ RMSE ของโมเดลสองโมเดลที่แตกต่างกันเพื่อดูว่าโมเดลใดเหมาะสมกับข้อมูลมากที่สุด
แหล่งข้อมูลเพิ่มเติม
เครื่องคิดเลข RMSE
วิธีการคำนวณ MSE ใน R
วิธีการคำนวณ MAPE ใน R