Come calcolare l'rmse in r


L’ errore quadratico medio (RMSE) è una misura che ci dice quanto i nostri valori previsti sono lontani dai valori osservati in un’analisi di regressione, in media. Viene calcolato come segue:

RMSE = √[ Σ(P i – O i ) 2 / n ]

Oro:

  • Σ è un simbolo di fantasia che significa “somma”
  • Pi è il valore previsto per l’ iesima osservazione nel set di dati
  • O i è il valore osservato per l’ iesima osservazione nel set di dati
  • n è la dimensione del campione

Questo tutorial spiega due metodi che puoi utilizzare per calcolare RMSE in R.

Metodo 1: scrivi la tua funzione

Supponiamo di avere un set di dati con una colonna contenente i valori dei dati effettivi e una colonna contenente i valori dei dati previsti:

 #create dataset
data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24),
                   predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23))

#view dataset
data

   actual predicted
1 34 37
2 37 40
3 44 46
4 47 44
5 48 46
6 48 50
7 46 45
8 43 44
9 32 34
10 27 30
11 26 22
12 24 23

Per calcolare l’RMSE, possiamo utilizzare la seguente funzione:

 #calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))

[1] 2.43242

L’errore quadratico medio è 2.43242 .

Metodo 2: utilizzare un pacchetto

Potremmo anche calcolare l’RMSE per lo stesso set di dati utilizzando la funzione rmse() del pacchetto Metrics , che utilizza la seguente sintassi:

rmse (effettivo, pianificato)

Oro:

  • reale: valori reali
  • predetto: valori previsti

Ecco la sintassi che utilizzeremmo nel nostro esempio:

 #load Metrics package
library(Metrics)

calculate RMSE
rmse(data$actual, data$predicted)

[1] 2.43242

L’errore quadratico medio è 2.43242 , che corrisponde a quanto calcolato in precedenza utilizzando la nostra funzione.

Come interpretare l’RMSE

RMSE è un modo utile per vedere quanto bene un modello di regressione è in grado di adattarsi a un set di dati.

Maggiore è l’RMSE, maggiore è la differenza tra i valori previsti e quelli osservati, il che significa che peggiore è l’adattamento del modello di regressione ai dati. Al contrario, più piccolo è l’RMSE, migliore è la capacità del modello di adattare i dati.

Può essere particolarmente utile confrontare l’RMSE di due diversi modelli per vedere quale modello si adatta meglio ai dati.

Risorse addizionali

Calcolatore RMSE
Come calcolare MSE in R
Come calcolare MAPE in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *