R'de rmse nasıl hesaplanır


Kök ortalama kare hatası (RMSE), tahmin edilen değerlerimizin bir regresyon analizinde gözlemlenen değerlerimizden ortalama olarak ne kadar uzakta olduğunu bize söyleyen bir ölçüdür. Aşağıdaki şekilde hesaplanır:

RMSE = √[ Σ(P ben – Ö ben ) 2 / n ]

Altın:

  • Σ “toplam” anlamına gelen süslü bir semboldür
  • P i , veri kümesindeki i’inci gözlem için tahmin edilen değerdir
  • Oi veri kümesindeki i’inci gözlem için gözlemlenen değerdir
  • n örneklem büyüklüğüdür

Bu eğitimde R’de RMSE’yi hesaplamak için kullanabileceğiniz iki yöntem açıklanmaktadır.

Yöntem 1: Kendi işlevinizi yazın

Gerçek veri değerlerini içeren bir sütuna ve tahmin edilen veri değerlerini içeren bir sütuna sahip bir veri kümemiz olduğunu varsayalım:

 #create dataset
data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24),
                   predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23))

#view dataset
data

   actual predicted
1 34 37
2 37 40
3 44 46
4 47 44
5 48 46
6 48 50
7 46 45
8 43 44
9 32 34
10 27 30
11 26 22
12 24 23

RMSE’yi hesaplamak için aşağıdaki işlevi kullanabiliriz:

 #calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))

[1] 2.43242

Ortalama kare hatası 2,43242’dir .

Yöntem 2: Paket kullanma

Aşağıdaki sözdizimini kullanan Metrics paketindeki rmse() işlevini kullanarak aynı veri kümesi için RMSE’yi de hesaplayabiliriz:

rmse (gerçek, planlanmış)

Altın:

  • gerçek: gerçek değerler
  • tahmin edilen: tahmin edilen değerler

Örneğimizde kullanacağımız sözdizimi şöyledir:

 #load Metrics package
library(Metrics)

calculate RMSE
rmse(data$actual, data$predicted)

[1] 2.43242

Ortalama kare hatası 2,43242’dir ve bu, daha önce kendi fonksiyonumuzu kullanarak hesapladığımızla eşleşir.

RMSE nasıl yorumlanır?

RMSE, bir regresyon modelinin bir veri kümesine ne kadar iyi uyum sağlayabildiğini görmenin yararlı bir yoludur.

RMSE ne kadar büyük olursa, tahmin edilen ve gözlemlenen değerler arasındaki fark da o kadar büyük olur; bu da regresyon modelinin verilere uymasının o kadar kötü olduğu anlamına gelir. Tersine, RMSE ne kadar küçük olursa model verilere o kadar iyi uyum sağlayabilir.

Hangi modelin verilere en iyi şekilde uyduğunu görmek için iki farklı modelin RMSE’sini karşılaştırmak özellikle yararlı olabilir.

Ek kaynaklar

RMSE Hesaplayıcı
R’de MSE nasıl hesaplanır
R’de MAPE nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir