Cara menghitung rmse di r


Root mean square error (RMSE) adalah ukuran yang memberi tahu kita seberapa jauh rata-rata nilai prediksi kita dari nilai pengamatan kita dalam analisis regresi. Ini dihitung sebagai berikut:

RMSE = √[ Σ(P i – O i ) 2 / n ]

Emas:

  • Σ adalah simbol mewah yang berarti “jumlah”
  • P i adalah nilai prediksi observasi ke-i dalam dataset
  • O i adalah nilai observasi untuk observasi ke-i dalam kumpulan data
  • n adalah ukuran sampel

Tutorial ini menjelaskan dua metode yang dapat Anda gunakan untuk menghitung RMSE di R.

Metode 1: Tulis fungsi Anda sendiri

Misalkan kita mempunyai dataset dengan kolom berisi nilai data aktual dan kolom berisi nilai data prediksi:

 #create dataset
data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24),
                   predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23))

#view dataset
data

   actual predicted
1 34 37
2 37 40
3 44 46
4 47 44
5 48 46
6 48 50
7 46 45
8 43 44
9 32 34
10 27 30
11 26 22
12 24 23

Untuk menghitung RMSE, kita dapat menggunakan fungsi berikut:

 #calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))

[1] 2.43242

Kesalahan kuadrat rata-rata adalah 2.43242 .

Metode 2: Gunakan paket

Kita juga dapat menghitung RMSE untuk kumpulan data yang sama menggunakan fungsi rmse() dari paket Metrics , yang menggunakan sintaksis berikut:

rmse (aktual, direncanakan)

Emas:

  • nyata: nilai nyata
  • diprediksi: nilai prediksi

Berikut adalah sintaks yang akan kita gunakan dalam contoh kita:

 #load Metrics package
library(Metrics)

calculate RMSE
rmse(data$actual, data$predicted)

[1] 2.43242

Kesalahan kuadrat rata-ratanya adalah 2.43242 , yang cocok dengan apa yang kita hitung sebelumnya menggunakan fungsi kita sendiri.

Bagaimana menafsirkan RMSE

RMSE adalah cara yang berguna untuk melihat seberapa baik model regresi dapat menyesuaikan dengan kumpulan data.

Semakin besar RMSE, semakin besar perbedaan antara nilai prediksi dan observasi, yang berarti semakin buruk kecocokan model regresi dengan data. Sebaliknya, semakin kecil RMSE, maka model tersebut semakin mampu menyesuaikan dengan data.

Akan sangat berguna jika membandingkan RMSE dari dua model berbeda untuk melihat model mana yang paling sesuai dengan data.

Sumber daya tambahan

Kalkulator RMSE
Cara menghitung UMK di R
Cara menghitung MAPE di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *