如何用 python 计算 rmse
均方根误差 (RMSE)是一个指标,它告诉我们模型中的预测值与观测值的平均差距有多大。计算方法如下:
RMSE = √[ Σ(P i – O i ) 2 / n ]
金子:
- Σ 是一个奇特的符号,意思是“和”
- P i是第 i 个观测值的预测值
- O i是第 i 个观测值的观测值
- n 是样本量
本教程介绍了一种在 Python 中计算 RMSE 的简单方法。
示例:用 Python 计算 RMSE
假设我们有以下实际值和预测值表:
actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24] pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]
要计算实际值和预测值之间的 RMSE,我们可以简单地取sklearn.metrics 库中的Mean_squared_error()函数的平方根:
#import necessary libraries from sklearn.metrics import mean_squared_error from math import sqrt #calculate RMSE sqrt(mean_squared_error(actual, pred)) 2.4324199198
RMSE 结果为2.4324 。
如何解释 RMSE
RMSE 是查看模型与数据集拟合程度的有用方法。 RMSE 越大,预测值和观测值之间的差异越大,意味着模型对数据的拟合程度越差。相反,RMSE 越小,模型对数据的拟合效果越好。
比较两个不同模型的 RMSE 以了解哪个模型最适合数据尤其有用。