Cara menghitung rata-rata kesalahan absolut di r


Dalam statistik, mean absolute error (MAE) adalah cara untuk mengukur keakuratan model tertentu. Ini dihitung sebagai berikut:

MAE = (1/n) * Σ|y saya – x saya |

Emas:

  • Σ: Simbol Yunani yang berarti “jumlah”
  • y i : Nilai observasi untuk observasi ke-i
  • x i : nilai prediksi pengamatan ke-i
  • n : Jumlah total observasi

Kita dapat menghitung rata-rata kesalahan absolut di R menggunakan fungsi mae (aktual, prediksi) dari paket Metrics .

Tutorial ini memberikan dua contoh cara menggunakan fitur ini dalam praktik.

Contoh 1: Hitung rata-rata kesalahan absolut antara dua vektor

Kode berikut menunjukkan cara menghitung rata-rata kesalahan absolut antara vektor nilai yang diamati dan vektor nilai prediksi:

 library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

Rata-rata kesalahan absolut (MAE) ternyata 1,909 .

Hal ini memberitahu kita bahwa rata-rata perbedaan absolut antara nilai yang diamati dan nilai yang diprediksi adalah 1,909.

Contoh 2: Hitung Mean Absolute Error untuk Model Regresi

Kode berikut menunjukkan cara menyesuaikan model regresi di R dan kemudian menghitung rata-rata kesalahan absolut antara prediksi yang dibuat oleh model dan nilai respons aktual yang diamati:

 library (Metrics)

#create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
                 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
                 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

Rata-rata kesalahan absolut (MAE) ternyata 1,238 .

Hal ini memberitahu kita bahwa rata-rata perbedaan absolut antara nilai yang diamati dan nilai yang diprediksi adalah 1,238.

Secara umum, semakin rendah nilai MAE, semakin baik kemampuan suatu model untuk menyesuaikan dengan kumpulan data. Saat kita membandingkan dua model berbeda, kita dapat membandingkan MAE masing-masing model untuk mengetahui model mana yang paling sesuai dengan kumpulan data.

Sumber daya tambahan

Berarti Kalkulator Kesalahan Absolut
Cara Menghitung Mean Absolute Error di Excel
Cara Menghitung Rata-Rata Kesalahan Absolut dengan Python

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *