Як розрахувати rmse в r
Середньоквадратична помилка (RMSE) — це міра, яка повідомляє нам, наскільки далекі наші прогнозовані значення в середньому від спостережуваних значень у регресійному аналізі. Він розраховується таким чином:
RMSE = √[ Σ(P i – O i ) 2 / n ]
золото:
- Σ – химерний символ, який означає «сума»
- P i – прогнозоване значення для i-го спостереження в наборі даних
- O i — спостережене значення для i-го спостереження в наборі даних
- n – розмір вибірки
У цьому підручнику пояснюється два методи, які можна використовувати для обчислення RMSE у R.
Спосіб 1: Напишіть власну функцію
Припустимо, у нас є набір даних зі стовпцем, що містить фактичні значення даних, і стовпцем, що містить прогнозовані значення даних:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
Щоб обчислити RMSE, ми можемо використати таку функцію:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
Середня квадратична помилка дорівнює 2,43242 .
Спосіб 2: Використовуйте пакет
Ми також можемо обчислити RMSE для того самого набору даних за допомогою функції rmse() із пакета Metrics , яка використовує такий синтаксис:
rmse (фактичний, запланований)
золото:
- real: справжні цінності
- прогнозовано: прогнозовані значення
Ось синтаксис, який ми будемо використовувати в нашому прикладі:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
Середня квадратична помилка становить 2,43242 , що відповідає тому, що ми обчислили раніше за допомогою нашої власної функції.
Як інтерпретувати RMSE
RMSE — це корисний спосіб побачити, наскільки регресійна модель здатна відповідати набору даних.
Чим більше RMSE, тим більша різниця між прогнозованими та спостережуваними значеннями, тобто тим гірше модель регресії відповідає даним. Навпаки, чим менший RMSE, тим краще модель може відповідати даним.
Особливо корисним може бути порівняння RMSE двох різних моделей, щоб побачити, яка модель найкраще відповідає даним.
Додаткові ресурси
Калькулятор RMSE
Як розрахувати MSE в R
Як розрахувати MAPE в R