Como calcular rmse em r


A raiz do erro quadrático médio (RMSE) é uma medida que nos diz a que distância nossos valores previstos estão dos valores observados em uma análise de regressão, em média. É calculado da seguinte forma:

RMSE = √[ Σ(P i – O i ) 2 / n ]

Ouro:

  • Σ é um símbolo sofisticado que significa “soma”
  • Pi é o valor previsto para a i-ésima observação no conjunto de dados
  • O i é o valor observado para a i-ésima observação no conjunto de dados
  • n é o tamanho da amostra

Este tutorial explica dois métodos que você pode usar para calcular RMSE em R.

Método 1: escreva sua própria função

Suponha que temos um conjunto de dados com uma coluna contendo os valores reais dos dados e uma coluna contendo os valores previstos dos dados:

 #create dataset
data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24),
                   predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23))

#view dataset
data

   actual predicted
1 34 37
2 37 40
3 44 46
4 47 44
5 48 46
6 48 50
7 46 45
8 43 44
9 32 34
10 27 30
11 26 22
12 24 23

Para calcular o RMSE, podemos usar a seguinte função:

 #calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))

[1] 2.43242

O erro quadrático médio é 2,43242 .

Método 2: use um pacote

Também poderíamos calcular o RMSE para o mesmo conjunto de dados usando a função rmse() do pacote Metrics , que usa a seguinte sintaxe:

rmse (real, planejado)

Ouro:

  • real: valores reais
  • previsto: valores previstos

Aqui está a sintaxe que usaríamos em nosso exemplo:

 #load Metrics package
library(Metrics)

calculate RMSE
rmse(data$actual, data$predicted)

[1] 2.43242

O erro quadrático médio é 2,43242 , o que corresponde ao que calculamos anteriormente usando nossa própria função.

Como interpretar o RMSE

O RMSE é uma maneira útil de ver até que ponto um modelo de regressão é capaz de se ajustar a um conjunto de dados.

Quanto maior o RMSE, maior a diferença entre os valores previstos e observados, ou seja, pior o modelo de regressão se ajusta aos dados. Por outro lado, quanto menor o RMSE, melhor o modelo é capaz de ajustar os dados.

Pode ser particularmente útil comparar o RMSE de dois modelos diferentes para ver qual modelo melhor se ajusta aos dados.

Recursos adicionais

Calculadora RMSE
Como calcular MSE em R
Como calcular o MAPE em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *