Як розрахувати rmse в r


Середньоквадратична помилка (RMSE) — це міра, яка повідомляє нам, наскільки далекі наші прогнозовані значення в середньому від спостережуваних значень у регресійному аналізі. Він розраховується таким чином:

RMSE = √[ Σ(P i – O i ) 2 / n ]

золото:

  • Σ – химерний символ, який означає «сума»
  • P i – прогнозоване значення для i-го спостереження в наборі даних
  • O i — спостережене значення для i-го спостереження в наборі даних
  • n – розмір вибірки

У цьому підручнику пояснюється два методи, які можна використовувати для обчислення RMSE у R.

Спосіб 1: Напишіть власну функцію

Припустимо, у нас є набір даних зі стовпцем, що містить фактичні значення даних, і стовпцем, що містить прогнозовані значення даних:

 #create dataset
data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24),
                   predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23))

#view dataset
data

   actual predicted
1 34 37
2 37 40
3 44 46
4 47 44
5 48 46
6 48 50
7 46 45
8 43 44
9 32 34
10 27 30
11 26 22
12 24 23

Щоб обчислити RMSE, ми можемо використати таку функцію:

 #calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))

[1] 2.43242

Середня квадратична помилка дорівнює 2,43242 .

Спосіб 2: Використовуйте пакет

Ми також можемо обчислити RMSE для того самого набору даних за допомогою функції rmse() із пакета Metrics , яка використовує такий синтаксис:

rmse (фактичний, запланований)

золото:

  • real: справжні цінності
  • прогнозовано: прогнозовані значення

Ось синтаксис, який ми будемо використовувати в нашому прикладі:

 #load Metrics package
library(Metrics)

calculate RMSE
rmse(data$actual, data$predicted)

[1] 2.43242

Середня квадратична помилка становить 2,43242 , що відповідає тому, що ми обчислили раніше за допомогою нашої власної функції.

Як інтерпретувати RMSE

RMSE — це корисний спосіб побачити, наскільки регресійна модель здатна відповідати набору даних.

Чим більше RMSE, тим більша різниця між прогнозованими та спостережуваними значеннями, тобто тим гірше модель регресії відповідає даним. Навпаки, чим менший RMSE, тим краще модель може відповідати даним.

Особливо корисним може бути порівняння RMSE двох різних моделей, щоб побачити, яка модель найкраще відповідає даним.

Додаткові ресурси

Калькулятор RMSE
Як розрахувати MSE в R
Як розрахувати MAPE в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *