Comment calculer le RMSE en Python



L’ erreur quadratique moyenne (RMSE) est une métrique qui nous indique à quel point nos valeurs prédites sont éloignées de nos valeurs observées dans un modèle, en moyenne. Il est calculé comme suit :

RMSE = √[ Σ(P i – O i ) 2 / n ]

où:

  • Σ est un symbole fantaisiste qui signifie « somme »
  • P i est la valeur prédite pour la ième observation
  • O i est la valeur observée pour la ième observation
  • n est la taille de l’échantillon

Ce tutoriel explique une méthode simple pour calculer le RMSE en Python.

Exemple : calculer le RMSE en Python

Supposons que nous ayons les tableaux suivants de valeurs réelles et prédites :

actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]

Pour calculer le RMSE entre les valeurs réelles et prédites, nous pouvons simplement prendre la racine carrée de la fonction Mean_squared_error() de la bibliothèque sklearn.metrics :

#import necessary libraries
from sklearn.metrics import mean_squared_error
from math import sqrt

#calculate RMSE
sqrt(mean_squared_error(actual, pred)) 

2.4324199198

Le RMSE s’avère être de 2,4324 .

Comment interpréter le RMSE

RMSE est un moyen utile de voir dans quelle mesure un modèle est capable de s’adapter à un ensemble de données. Plus le RMSE est grand, plus la différence entre les valeurs prédites et observées est grande, ce qui signifie que moins le modèle s’adapte aux données. À l’inverse, plus le RMSE est petit, plus le modèle est capable de s’adapter aux données.

Il peut être particulièrement utile de comparer le RMSE de deux modèles différents pour voir quel modèle correspond le mieux aux données.

Ressources additionnelles

Calculateur RMSE
Comment calculer l’erreur quadratique moyenne (MSE) en Python
Comment calculer MAPE en Python

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *