Come calcolare l'rmse in r
L’ errore quadratico medio (RMSE) è una misura che ci dice quanto i nostri valori previsti sono lontani dai valori osservati in un’analisi di regressione, in media. Viene calcolato come segue:
RMSE = √[ Σ(P i – O i ) 2 / n ]
Oro:
- Σ è un simbolo di fantasia che significa “somma”
- Pi è il valore previsto per l’ iesima osservazione nel set di dati
- O i è il valore osservato per l’ iesima osservazione nel set di dati
- n è la dimensione del campione
Questo tutorial spiega due metodi che puoi utilizzare per calcolare RMSE in R.
Metodo 1: scrivi la tua funzione
Supponiamo di avere un set di dati con una colonna contenente i valori dei dati effettivi e una colonna contenente i valori dei dati previsti:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
Per calcolare l’RMSE, possiamo utilizzare la seguente funzione:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
L’errore quadratico medio è 2.43242 .
Metodo 2: utilizzare un pacchetto
Potremmo anche calcolare l’RMSE per lo stesso set di dati utilizzando la funzione rmse() del pacchetto Metrics , che utilizza la seguente sintassi:
rmse (effettivo, pianificato)
Oro:
- reale: valori reali
- predetto: valori previsti
Ecco la sintassi che utilizzeremmo nel nostro esempio:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
L’errore quadratico medio è 2.43242 , che corrisponde a quanto calcolato in precedenza utilizzando la nostra funzione.
Come interpretare l’RMSE
RMSE è un modo utile per vedere quanto bene un modello di regressione è in grado di adattarsi a un set di dati.
Maggiore è l’RMSE, maggiore è la differenza tra i valori previsti e quelli osservati, il che significa che peggiore è l’adattamento del modello di regressione ai dati. Al contrario, più piccolo è l’RMSE, migliore è la capacità del modello di adattare i dati.
Può essere particolarmente utile confrontare l’RMSE di due diversi modelli per vedere quale modello si adatta meglio ai dati.
Risorse addizionali
Calcolatore RMSE
Come calcolare MSE in R
Come calcolare MAPE in R