R'de rmse nasıl hesaplanır
Kök ortalama kare hatası (RMSE), tahmin edilen değerlerimizin bir regresyon analizinde gözlemlenen değerlerimizden ortalama olarak ne kadar uzakta olduğunu bize söyleyen bir ölçüdür. Aşağıdaki şekilde hesaplanır:
RMSE = √[ Σ(P ben – Ö ben ) 2 / n ]
Altın:
- Σ “toplam” anlamına gelen süslü bir semboldür
- P i , veri kümesindeki i’inci gözlem için tahmin edilen değerdir
- Oi veri kümesindeki i’inci gözlem için gözlemlenen değerdir
- n örneklem büyüklüğüdür
Bu eğitimde R’de RMSE’yi hesaplamak için kullanabileceğiniz iki yöntem açıklanmaktadır.
Yöntem 1: Kendi işlevinizi yazın
Gerçek veri değerlerini içeren bir sütuna ve tahmin edilen veri değerlerini içeren bir sütuna sahip bir veri kümemiz olduğunu varsayalım:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
RMSE’yi hesaplamak için aşağıdaki işlevi kullanabiliriz:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
Ortalama kare hatası 2,43242’dir .
Yöntem 2: Paket kullanma
Aşağıdaki sözdizimini kullanan Metrics paketindeki rmse() işlevini kullanarak aynı veri kümesi için RMSE’yi de hesaplayabiliriz:
rmse (gerçek, planlanmış)
Altın:
- gerçek: gerçek değerler
- tahmin edilen: tahmin edilen değerler
Örneğimizde kullanacağımız sözdizimi şöyledir:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
Ortalama kare hatası 2,43242’dir ve bu, daha önce kendi fonksiyonumuzu kullanarak hesapladığımızla eşleşir.
RMSE nasıl yorumlanır?
RMSE, bir regresyon modelinin bir veri kümesine ne kadar iyi uyum sağlayabildiğini görmenin yararlı bir yoludur.
RMSE ne kadar büyük olursa, tahmin edilen ve gözlemlenen değerler arasındaki fark da o kadar büyük olur; bu da regresyon modelinin verilere uymasının o kadar kötü olduğu anlamına gelir. Tersine, RMSE ne kadar küçük olursa model verilere o kadar iyi uyum sağlayabilir.
Hangi modelin verilere en iyi şekilde uyduğunu görmek için iki farklı modelin RMSE’sini karşılaştırmak özellikle yararlı olabilir.
Ek kaynaklar
RMSE Hesaplayıcı
R’de MSE nasıl hesaplanır
R’de MAPE nasıl hesaplanır