Cara menghitung rmse di r
Root mean square error (RMSE) adalah ukuran yang memberi tahu kita seberapa jauh rata-rata nilai prediksi kita dari nilai pengamatan kita dalam analisis regresi. Ini dihitung sebagai berikut:
RMSE = √[ Σ(P i – O i ) 2 / n ]
Emas:
- Σ adalah simbol mewah yang berarti “jumlah”
- P i adalah nilai prediksi observasi ke-i dalam dataset
- O i adalah nilai observasi untuk observasi ke-i dalam kumpulan data
- n adalah ukuran sampel
Tutorial ini menjelaskan dua metode yang dapat Anda gunakan untuk menghitung RMSE di R.
Metode 1: Tulis fungsi Anda sendiri
Misalkan kita mempunyai dataset dengan kolom berisi nilai data aktual dan kolom berisi nilai data prediksi:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
Untuk menghitung RMSE, kita dapat menggunakan fungsi berikut:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
Kesalahan kuadrat rata-rata adalah 2.43242 .
Metode 2: Gunakan paket
Kita juga dapat menghitung RMSE untuk kumpulan data yang sama menggunakan fungsi rmse() dari paket Metrics , yang menggunakan sintaksis berikut:
rmse (aktual, direncanakan)
Emas:
- nyata: nilai nyata
- diprediksi: nilai prediksi
Berikut adalah sintaks yang akan kita gunakan dalam contoh kita:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
Kesalahan kuadrat rata-ratanya adalah 2.43242 , yang cocok dengan apa yang kita hitung sebelumnya menggunakan fungsi kita sendiri.
Bagaimana menafsirkan RMSE
RMSE adalah cara yang berguna untuk melihat seberapa baik model regresi dapat menyesuaikan dengan kumpulan data.
Semakin besar RMSE, semakin besar perbedaan antara nilai prediksi dan observasi, yang berarti semakin buruk kecocokan model regresi dengan data. Sebaliknya, semakin kecil RMSE, maka model tersebut semakin mampu menyesuaikan dengan data.
Akan sangat berguna jika membandingkan RMSE dari dua model berbeda untuk melihat model mana yang paling sesuai dengan data.
Sumber daya tambahan
Kalkulator RMSE
Cara menghitung UMK di R
Cara menghitung MAPE di R