วิธีการคำนวณค่าเฉลี่ยความคลาดเคลื่อนสัมบูรณ์ใน r
ในทางสถิติ ค่าเฉลี่ยความคลาดเคลื่อนสัมบูรณ์ (MAE) เป็นวิธีการวัดความแม่นยำของแบบจำลองที่กำหนด มีการคำนวณดังนี้:
แม่ = (1/n) * Σ|y ฉัน – x ฉัน |
ทอง:
- Σ: สัญลักษณ์กรีกหมายถึง “ผลรวม”
- y i : ค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3
- x i : ค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ 3
- n: จำนวนการสังเกตทั้งหมด
เราสามารถคำนวณค่าคลาดเคลื่อนสัมบูรณ์เฉลี่ยใน R ได้โดยใช้ฟังก์ชัน mae (ตามจริง คาดการณ์) จากแพ็คเกจ Metrics
บทช่วยสอนนี้มีตัวอย่างสองตัวอย่างเกี่ยวกับวิธีใช้ฟีเจอร์นี้ในทางปฏิบัติ
ตัวอย่างที่ 1: คำนวณความคลาดเคลื่อนสัมบูรณ์เฉลี่ยระหว่างเวกเตอร์สองตัว
รหัสต่อไปนี้แสดงวิธีคำนวณความคลาดเคลื่อนสัมบูรณ์โดยเฉลี่ยระหว่างเวกเตอร์ของค่าที่สังเกตได้และเวกเตอร์ของค่าที่ทำนายไว้:
library (Metrics) #define observed and predicted values observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32) predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30) #calculate mean absolute error between vectors mae(observed, predicted) [1] 1.909091
ข้อผิดพลาดเฉลี่ยสัมบูรณ์ (MAE) กลายเป็น 1.909
สิ่งนี้บอกเราว่าความแตกต่างสัมบูรณ์โดยเฉลี่ยระหว่างค่าที่สังเกตได้กับค่าที่ทำนายคือ 1.909
ตัวอย่างที่ 2: คำนวณค่าความคลาดเคลื่อนสัมบูรณ์เฉลี่ยสำหรับแบบจำลองการถดถอย
รหัสต่อไปนี้แสดงวิธีการปรับให้พอดีกับ แบบจำลองการถดถอย ใน R จากนั้นคำนวณข้อผิดพลาดสัมบูรณ์โดยเฉลี่ยระหว่างการคาดการณ์ที่ทำโดยแบบจำลองและค่าตอบสนองที่สังเกตได้จริง:
library (Metrics) #create data df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3), x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34), y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32)) #view first six rows of data head(df) x1 x2 y 1 1 7 17 2 3 7 18 3 3 4 19 4 4 10 20 5 4 13 24 6 6 12 28 #fit regression model model <- lm(y~x1+x2, data=df) #calculate MAE between predicted values and observed values mae(df$y, predict(model)) [1] 1.238241
ข้อผิดพลาดเฉลี่ยสัมบูรณ์ (MAE) กลายเป็น 1.238
สิ่งนี้บอกเราว่าความแตกต่างสัมบูรณ์โดยเฉลี่ยระหว่างค่าที่สังเกตได้กับค่าที่ทำนายคือ 1.238
โดยทั่วไป ยิ่งค่า MAE ต่ำลง โมเดลก็จะสามารถใส่ชุดข้อมูลได้ดีขึ้นเท่านั้น เมื่อเราเปรียบเทียบสองรุ่นที่แตกต่างกัน เราสามารถเปรียบเทียบ MAE ของแต่ละรุ่นเพื่อดูว่ารุ่นใดที่เหมาะกับชุดข้อมูลมากที่สุด
แหล่งข้อมูลเพิ่มเติม
หมายถึงเครื่องคำนวณข้อผิดพลาดสัมบูรณ์
วิธีการคำนวณค่าเฉลี่ยข้อผิดพลาดสัมบูรณ์ใน Excel
วิธีการคำนวณค่าเฉลี่ยข้อผิดพลาดสัมบูรณ์ใน Python