Comment calculer MSE dans R
L’une des mesures les plus couramment utilisées pour mesurer la précision de prédiction d’un modèle est MSE , qui signifie erreur quadratique moyenne . Il est calculé comme suit :
MSE = (1/n) * Σ(réel – prédiction) 2
où:
- Σ – un symbole fantaisiste qui signifie « somme »
- n – taille de l’échantillon
- réel – la valeur réelle des données
- prédiction – la valeur des données prédites
Plus la valeur du MSE est faible, plus un modèle est capable de prédire les valeurs avec précision.
Comment calculer MSE dans R
Selon le format dans lequel se trouvent vos données, il existe deux méthodes simples que vous pouvez utiliser pour calculer le MSE d’un modèle de régression dans R.
Méthode 1 : calculer le MSE à partir du modèle de régression
Dans un scénario, vous disposez peut-être d’un modèle de régression ajusté et souhaitez simplement calculer le MSE du modèle. Par exemple, vous pouvez avoir le modèle de régression suivant :
#load mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #get model summary model_summ <-summary(model)
Pour calculer le MSE de ce modèle, vous pouvez utiliser la formule suivante :
#calculate MSE
mean(model_summ$residuals^2)
[1] 8.85917
Cela nous indique que le MSE est de 8,85917 .
Méthode 2 : calculer le MSE à partir d’une liste de valeurs prédites et réelles
Dans un autre scénario, vous pouvez simplement disposer d’une liste de valeurs prévues et réelles. Par exemple:
#create data frame with a column of actual values and a column of predicted values data <- data.frame(pred = predict(model), actual = mtcars$mpg) #view first six lines of data head(data) pred actual Mazda RX4 23.14809 21.0 Mazda RX4 Wag 23.14809 21.0 Datsun 710 25.14838 22.8 Hornet 4 Drive 20.17416 21.4 Hornet Sportabout 15.46423 18.7 Valiant 21.29978 18.1
Dans ce cas, vous pouvez utiliser la formule suivante pour calculer le MSE :
#calculate MSE
mean((data$actual - data$pred)^2)
[1] 8.85917
Cela nous indique que le MSE est de 8,85917 , ce qui correspond au MSE que nous avons calculé à l’aide de la méthode précédente.