Mse vs. rmse: hangi metriği kullanmalısınız?
Regresyon modelleri, bir veya daha fazla yordayıcı değişken ile bir yanıt değişkeni arasındaki ilişkiyi ölçmek için kullanılır.
Ne zaman bir regresyon modeli uydursak, modelin, yanıt değişkeninin değerini tahmin etmek için yordayıcı değişkenlerin değerlerini ne kadar iyi kullanabileceğini anlamak isteriz.
Bir modelin bir veri kümesine ne kadar iyi uyduğunu ölçmek için sıklıkla kullandığımız iki ölçüm, aşağıdaki gibi hesaplanan ortalama kare hatası (MSE) ve kök ortalama kare hatasıdır (RMSE):
MSE : Bir veri kümesindeki tahmin edilen değerler ile gerçek değerler arasındaki ortalama karekök farkının bize bildirildiği bir metrik. MSE ne kadar düşük olursa, model bir veri kümesine o kadar iyi uyar.
MSE = Σ(ŷ ben – y ben ) 2 / n
Altın:
- Σ “toplam” anlamına gelen bir semboldür
- ŷ i, i’inci gözlem için tahmin edilen değerdir
- y i, i’inci gözlem için gözlemlenen değerdir
- n örneklem büyüklüğüdür
RMSE : Bir veri kümesindeki tahmin edilen değerler ile gerçek değerler arasındaki ortalama kare farkının karekökünü bize söyleyen bir metrik. RMSE ne kadar düşük olursa, model bir veri setine o kadar iyi uyar.
Aşağıdaki şekilde hesaplanır:
RMSE = √ Σ(ŷ ben – y ben ) 2 / n
Altın:
- Σ “toplam” anlamına gelen bir semboldür
- ŷ i, i’inci gözlem için tahmin edilen değerdir
- y i, i’inci gözlem için gözlemlenen değerdir
- n örneklem büyüklüğüdür
Formüllerin neredeyse aynı olduğunu unutmayın. Aslında ortalama kare hatası, ortalama kare hatasının sadece kare köküdür.
RMSE vs. MSE: Hangi Metriği Kullanmalısınız?
Bir modelin bir veri kümesine ne kadar iyi uyduğunu değerlendirmek için RMSE’yi daha sık kullanırız çünkü yanıt değişkeniyle aynı birimlerde ölçülür.
Tersine, MSE yanıt değişkeninin kare birimleriyle ölçülür.
Bunu açıklamak için, bir basketbol maçında 10 oyuncunun kaç puan alacağını tahmin etmek için bir regresyon modeli kullandığımızı varsayalım.
Aşağıdaki tablo, model tarafından tahmin edilen puanların, oyuncuların attığı gerçek puanlarla karşılaştırmasını göstermektedir:
Ortalama kare hatasını (MSE) şu şekilde hesaplarız:
- MSE = Σ(ŷ ben – y ben ) 2 / n
- MSE = ((14-12) 2 +(15-15) 2 +(18-20) 2 +(19-16) 2 +(25-20) 2 +(18-19) 2 +(12-16) 2 +(12-20) 2 +(15-16) 2 +(22-16) 2 ) / 10
- MSE = 16
Kök ortalama kare hatası 16’dır. Bu bize modelin öngördüğü değerler ile gerçek değerler arasındaki kök ortalama kare farkının 16 olduğunu söyler.
Kök ortalama kare hatası (RMSE), basitçe MSE’nin karekökü olacaktır:
- ADE = √ EQM
- RMSE = √ 16
- RMSE = 4
Ortalama kare hatası 4’tür. Bu bize, atılan tahmin edilen puanlar ile atılan gerçek puanlar arasındaki ortalama sapmanın 4 olduğunu söyler.
Ortalama karesel hatayı yorumlamanın ortalama karesel hatadan çok daha basit olduğunu unutmayın, çünkü burada “alınan puanların karesi” yerine “kazanılan puanlardan” bahsediyoruz.
RMSE pratikte nasıl kullanılır?
Uygulamada, genellikle birden fazla regresyon modelini bir veri kümesine sığdırırız ve her modelin ortalama karekök hatasını (RMSE) hesaplarız.
Daha sonra RMSE değeri en düşük olan modeli “en iyi” model olarak seçiyoruz çünkü tahminleri veri setindeki gerçek değerlere en yakın yapan modeldir.
Her modelin MSE değerlerini de karşılaştırabileceğimizi ancak RMSE’nin yorumlanmasının daha basit olduğunu ve bu nedenle daha sık kullanıldığını unutmayın.
Ek kaynaklar
Çoklu Doğrusal Regresyona Giriş
RMSE ve R-Squared: Hangi Metriği Kullanmalısınız?
RMSE Hesaplayıcı