Python で rmse を計算する方法


二乗平均平方根誤差 (RMSE)は、予測値がモデルの観測値から平均してどの程度離れているかを示す指標です。次のように計算されます。

RMSE = √[ Σ(P i – O i ) 2 / n ]

金:

  • Σは「和」を意味する派手な記号です
  • Pii 番目の観測値の予測値です
  • O ii 番目の観測値の観測値です
  • n はサンプルサイズです

このチュートリアルでは、Python で RMSE を計算する簡単な方法を説明します。

例: Python で RMSE を計算する

実際の値と予測値を示す次の表があるとします。

 actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]

実際の値と予測値の間の RMSE を計算するには、 sklearn.metrics ライブラリからMean_squared_error()関数の平方根を取得するだけです

 #import necessary libraries
from sklearn.metrics import mean_squared_error
from math import sqrt

#calculate RMSE
sqrt(mean_squared_error(actual, pred)) 

2.4324199198

RMSE は2.4324であることがわかります。

RMSEの解釈方法

RMSE は、モデルがデータセットにどの程度適合できるかを確認するのに便利な方法です。 RMSE が大きいほど、予測値と観測値の差が大きくなり、モデルのデータへの適合性が低下することを意味します。逆に、RMSE が小さいほど、モデルはデータにうまく適合できます。

2 つの異なるモデルの RMSE を比較して、どのモデルがデータに最も適合するかを確認することは特に便利です。

追加リソース

RMSE計算機
Python で平均二乗誤差 (MSE) を計算する方法
Python で MAPE を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です