ما الذي يعتبر قيمة rmse جيدة؟
إحدى طرق تقييم مدى ملاءمة نموذج الانحدار لمجموعة بيانات هي حساب متوسط مربع الخطأ ، والذي يخبرنا بمتوسط المسافة بين القيم المتوقعة للنموذج والقيم الفعلية لمجموعة البيانات. بيانات.
صيغة العثور على متوسط مربع الخطأ، والتي غالبًا ما يتم اختصارها بـ RMSE ، هي:
RMSE = √ Σ(P i – O i ) 2 / n
ذهب:
- Σ هو رمز خيالي يعني “المجموع”
- P i هي القيمة المتوقعة للملاحظة i في مجموعة البيانات
- O i هي القيمة المرصودة للملاحظة رقم في مجموعة البيانات
- n هو حجم العينة
السؤال الذي يطرحه الناس غالبًا هو: ما هي قيمة RMSE الجيدة؟
الجواب القصير: ذلك يعتمد .
كلما انخفض RMSE، كلما كان النموذج المعطى قادرًا على “ملاءمة” مجموعة البيانات بشكل أفضل. ومع ذلك، فإن نطاق مجموعة البيانات التي تعمل بها مهم في تحديد ما إذا كانت قيمة RMSE معينة “منخفضة” أم لا.
على سبيل المثال، خذ بعين الاعتبار السيناريوهات التالية:
السيناريو 1: نود استخدام نموذج الانحدار للتنبؤ بأسعار المنازل في مدينة معينة. افترض أن النموذج له قيمة RMSE بقيمة 500 دولار. نظرًا لأن النطاق السعري للمنزل النموذجي يتراوح بين 70.000 دولار و300.000 دولار، فإن قيمة RMSE هذه منخفضة للغاية. وهذا يخبرنا أن النموذج قادر على التنبؤ بدقة بأسعار العقارات.
السيناريو 2: لنفترض الآن أننا نريد استخدام نموذج الانحدار للتنبؤ بالمبلغ الذي سينفقه الشخص شهريًا في مدينة معينة. افترض أن النموذج له قيمة RMSE بقيمة 500 دولار. إذا كان نطاق الإنفاق الشهري النموذجي يتراوح بين 1500 دولار و4000 دولار، فإن قيمة RMSE هذه مرتفعة جدًا. وهذا يخبرنا أن النموذج غير قادر على التنبؤ بالنفقات الشهرية بدقة كبيرة.
توضح هذه الأمثلة البسيطة أنه لا توجد قيمة RMSE “جيدة” عالمية. كل هذا يتوقف على نطاق قيمة مجموعة البيانات التي تعمل معها.
تطبيع قيمة RMSE
إحدى الطرق لفهم ما إذا كانت قيمة RMSE معينة “جيدة” بشكل أفضل هي تطبيعها باستخدام الصيغة التالية:
RMSE المعياري = RMSE / (القيمة القصوى – القيمة الدنيا)
وينتج عن ذلك قيمة بين 0 و1، حيث تمثل القيم الأقرب إلى 0 نماذج ملائمة أفضل.
على سبيل المثال، لنفترض أن قيمة RMSE لدينا هي 500 دولار أمريكي ونطاق القيمة لدينا هو 70000 دولار أمريكي إلى 300000 دولار أمريكي. سنقوم بحساب قيمة RMSE المقيسة على النحو التالي:
- RMSE المقيس = 500 دولار / (300000 دولار – 70000 دولار) = 0.002
على العكس من ذلك، لنفترض أن قيمة RMSE لدينا هي 500 دولار أمريكي وأن نطاق القيمة لدينا يتراوح بين 1500 دولار أمريكي و4000 دولار أمريكي. سنقوم بحساب قيمة RMSE المقيسة على النحو التالي:
- RMSE المعياري = 500 دولار / (4000 دولار – 1500 دولار) = 0.2 .
تكون قيمة RMSE الأولى التي تمت تسويتها أقل بكثير، مما يشير إلى أنها توفر ملاءمة أفضل بكثير للبيانات مقارنة بقيمة RMSE التي تمت تسويتها الثانية.
مقارنة RMSE بين النماذج
بدلاً من اختيار رقم عشوائي لتمثيل قيمة RMSE “الجيدة”، يمكننا ببساطة مقارنة قيم RMSE لنماذج متعددة.
على سبيل المثال، لنفترض أننا نلائم ثلاثة نماذج انحدار مختلفة للتنبؤ بأسعار العقارات. افترض أن النماذج الثلاثة تحتوي على قيم RMSE التالية:
- الموديل 1 RMSE: 550 دولارًا
- الموديل 2 RMSE: 480 دولارًا
- الموديل 3 RMSE: 1400 دولار
نظرًا لأن قيمة RMSE للنموذج 2 هي الأدنى، فإننا نختار النموذج 2 كأفضل نموذج للتنبؤ بأسعار العقارات نظرًا لأن متوسط المسافة بين الأسعار المتوقعة والفعلية هو الأدنى لهذا النموذج.
مصادر إضافية
كيفية تفسير RMSE
كيفية حساب RMSE في إكسل
كيفية حساب RMSE في R
كيفية حساب RMSE في بايثون
حاسبة RMSE