كيفية حساب rmse في r
جذر متوسط مربع الخطأ (RMSE) هو مقياس يخبرنا بمدى اختلاف قيمنا المتوقعة عن قيمنا المرصودة في تحليل الانحدار، في المتوسط. يتم حسابه على النحو التالي:
RMSE = √[ Σ(P i – O i ) 2 / n ]
ذهب:
- Σ هو رمز خيالي يعني “المجموع”
- P i هي القيمة المتوقعة للملاحظة i في مجموعة البيانات
- O i هي القيمة المرصودة للملاحظة رقم في مجموعة البيانات
- n هو حجم العينة
يشرح هذا البرنامج التعليمي طريقتين يمكنك استخدامهما لحساب RMSE في R.
الطريقة الأولى: اكتب وظيفتك الخاصة
لنفترض أن لدينا مجموعة بيانات تحتوي على عمود يحتوي على قيم البيانات الفعلية وعمود يحتوي على قيم البيانات المتوقعة:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
لحساب RMSE، يمكننا استخدام الدالة التالية:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
متوسط مربع الخطأ هو 2.43242 .
الطريقة الثانية: استخدام الحزمة
يمكننا أيضًا حساب RMSE لنفس مجموعة البيانات باستخدام الدالة rmse() من حزمة Metrics ، والتي تستخدم الصيغة التالية:
rmse (الفعلي، المخطط له)
ذهب:
- الحقيقي: القيم الحقيقية
- تنبأ: القيم المتوقعة
إليك بناء الجملة الذي سنستخدمه في مثالنا:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
متوسط مربع الخطأ هو 2.43242 ، وهو ما يطابق ما حسبناه سابقًا باستخدام الدالة الخاصة بنا.
كيفية تفسير RMSE
تعد RMSE طريقة مفيدة لمعرفة مدى قدرة نموذج الانحدار على ملاءمة مجموعة البيانات.
كلما زاد حجم RMSE، زاد الفرق بين القيم المتوقعة والمرصودة، مما يعني أنه كلما كان نموذج الانحدار مناسبًا للبيانات. على العكس من ذلك، كلما كان RMSE أصغر، كلما كانت قدرة النموذج على ملاءمة البيانات أفضل.
قد يكون من المفيد بشكل خاص مقارنة RMSE لنموذجين مختلفين لمعرفة النموذج الذي يناسب البيانات بشكل أفضل.