วิธีการคำนวณค่าเฉลี่ยความคลาดเคลื่อนสัมบูรณ์ใน r


ในทางสถิติ ค่าเฉลี่ยความคลาดเคลื่อนสัมบูรณ์ (MAE) เป็นวิธีการวัดความแม่นยำของแบบจำลองที่กำหนด มีการคำนวณดังนี้:

แม่ = (1/n) * Σ|y ฉัน – x ฉัน |

ทอง:

  • Σ: สัญลักษณ์กรีกหมายถึง “ผลรวม”
  • y i : ค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3
  • x i : ค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ 3
  • n: จำนวนการสังเกตทั้งหมด

เราสามารถคำนวณค่าคลาดเคลื่อนสัมบูรณ์เฉลี่ยใน R ได้โดยใช้ฟังก์ชัน mae (ตามจริง คาดการณ์) จากแพ็คเกจ Metrics

บทช่วยสอนนี้มีตัวอย่างสองตัวอย่างเกี่ยวกับวิธีใช้ฟีเจอร์นี้ในทางปฏิบัติ

ตัวอย่างที่ 1: คำนวณความคลาดเคลื่อนสัมบูรณ์เฉลี่ยระหว่างเวกเตอร์สองตัว

รหัสต่อไปนี้แสดงวิธีคำนวณความคลาดเคลื่อนสัมบูรณ์โดยเฉลี่ยระหว่างเวกเตอร์ของค่าที่สังเกตได้และเวกเตอร์ของค่าที่ทำนายไว้:

 library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

ข้อผิดพลาดเฉลี่ยสัมบูรณ์ (MAE) กลายเป็น 1.909

สิ่งนี้บอกเราว่าความแตกต่างสัมบูรณ์โดยเฉลี่ยระหว่างค่าที่สังเกตได้กับค่าที่ทำนายคือ 1.909

ตัวอย่างที่ 2: คำนวณค่าความคลาดเคลื่อนสัมบูรณ์เฉลี่ยสำหรับแบบจำลองการถดถอย

รหัสต่อไปนี้แสดงวิธีการปรับให้พอดีกับ แบบจำลองการถดถอย ใน R จากนั้นคำนวณข้อผิดพลาดสัมบูรณ์โดยเฉลี่ยระหว่างการคาดการณ์ที่ทำโดยแบบจำลองและค่าตอบสนองที่สังเกตได้จริง:

 library (Metrics)

#create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
                 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
                 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

ข้อผิดพลาดเฉลี่ยสัมบูรณ์ (MAE) กลายเป็น 1.238

สิ่งนี้บอกเราว่าความแตกต่างสัมบูรณ์โดยเฉลี่ยระหว่างค่าที่สังเกตได้กับค่าที่ทำนายคือ 1.238

โดยทั่วไป ยิ่งค่า MAE ต่ำลง โมเดลก็จะสามารถใส่ชุดข้อมูลได้ดีขึ้นเท่านั้น เมื่อเราเปรียบเทียบสองรุ่นที่แตกต่างกัน เราสามารถเปรียบเทียบ MAE ของแต่ละรุ่นเพื่อดูว่ารุ่นใดที่เหมาะกับชุดข้อมูลมากที่สุด

แหล่งข้อมูลเพิ่มเติม

หมายถึงเครื่องคำนวณข้อผิดพลาดสัมบูรณ์
วิธีการคำนวณค่าเฉลี่ยข้อผิดพลาดสัมบูรณ์ใน Excel
วิธีการคำนวณค่าเฉลี่ยข้อผิดพลาดสัมบูรณ์ใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *