المشاريع الصغيرة والمتوسطة مقابل. rmse: ما هو المقياس الذي يجب عليك استخدامه؟
تُستخدم نماذج الانحدار لتحديد العلاقة بين واحد أو أكثر من متغيرات التوقع ومتغير الاستجابة .
عندما نلائم نموذج الانحدار، نريد أن نفهم مدى قدرة النموذج على استخدام قيم متغيرات التوقع للتنبؤ بقيمة متغير الاستجابة.
هناك مقياسان نستخدمهما غالبًا لتحديد مدى ملاءمة النموذج لمجموعة بيانات هما متوسط مربع الخطأ (MSE) وجذر متوسط مربع الخطأ (RMSE)، والتي يتم حسابها على النحو التالي:
MSE : مقياس يخبرنا بالفرق الجذري لمتوسط المربع بين القيم المتوقعة والقيم الفعلية في مجموعة البيانات. كلما انخفض MSE، كلما كان النموذج مناسبًا لمجموعة البيانات بشكل أفضل.
MSE = Σ(ŷ i – y i ) 2 / n
ذهب:
- Σ هو رمز يعني “المجموع”
- ŷ i هي القيمة المتوقعة للملاحظة i
- y i هي القيمة المرصودة للملاحظة i
- n هو حجم العينة
RMSE : مقياس يخبرنا بالجذر التربيعي لجذر متوسط مربع الفرق بين القيم المتوقعة والقيم الفعلية في مجموعة البيانات. كلما انخفض RMSE، كلما كان النموذج مناسبًا لمجموعة البيانات بشكل أفضل.
يتم حسابه على النحو التالي:
RMSE = √ Σ(ŷ i – y i ) 2 / n
ذهب:
- Σ هو رمز يعني “المجموع”
- ŷ i هي القيمة المتوقعة للملاحظة i
- y i هي القيمة المرصودة للملاحظة i
- n هو حجم العينة
لاحظ أن الصيغ متطابقة تقريبًا. في الواقع، متوسط الخطأ التربيعي هو مجرد الجذر التربيعي لمتوسط الخطأ التربيعي.
RMSE مقابل. MSE: ما هو المقياس الذي يجب عليك استخدامه؟
لتقييم مدى ملاءمة النموذج لمجموعة بيانات، نستخدم في كثير من الأحيان RMSE لأنه يتم قياسه بنفس وحدات متغير الاستجابة.
وعلى العكس من ذلك، يتم قياس المشروعات الصغيرة والمتوسطة بوحدات مربعة من متغير الاستجابة.
لتوضيح ذلك، لنفترض أننا نستخدم نموذج الانحدار للتنبؤ بعدد النقاط التي سيسجلها 10 لاعبين في مباراة كرة السلة.
والجدول التالي يوضح النقاط التي تنبأ بها النموذج مقارنة بالنقاط الفعلية التي سجلها اللاعبون:
سنقوم بحساب متوسط الخطأ المربع (MSE) على النحو التالي:
- MSE = Σ(ŷ i – y i ) 2 / n
- متوسطة الحجم = ((14-12) 2 +(15-15) 2 +(18-20) 2 +(19-16) 2 +(25-20) 2 +(18-19) 2 +(12-16) 2 +(12-20) 2 +(15-16) 2 +(22-16) 2 ) / 10
- المشاريع الصغيرة والمتوسطة = 16
جذر متوسط مربع الخطأ هو 16. وهذا يخبرنا أن جذر متوسط مربع الفرق بين القيم التي تنبأ بها النموذج والقيم الفعلية هو 16.
سيكون الجذر التربيعي للخطأ التربيعي (RMSE) ببساطة هو الجذر التربيعي للخطأ التربيعي المتوسط:
- ADE = √ EQM
- آر إم إس إي = √ 16
- RMSE = 4
متوسط مربع الخطأ هو 4. وهذا يخبرنا أن متوسط الانحراف بين النقاط المتوقعة المسجلة والنقاط الفعلية المسجلة هو 4.
لاحظ أن تفسير متوسط الخطأ المربع أبسط بكثير من متوسط الخطأ المربع، لأننا نتحدث عن “النقاط المسجلة” بدلاً من “النقاط المسجلة”.
كيفية استخدام RMSE في الممارسة العملية
من الناحية العملية، نقوم عادةً بتناسب نماذج الانحدار المتعددة مع مجموعة بيانات وحساب جذر متوسط مربع الخطأ (RMSE) لكل نموذج.
نقوم بعد ذلك باختيار النموذج ذو أقل قيمة RMSE باعتباره النموذج “الأفضل”، لأنه هو الذي يجعل التنبؤات أقرب إلى القيم الفعلية في مجموعة البيانات.
لاحظ أنه يمكننا أيضًا مقارنة قيم MSE لكل نموذج، ولكن تفسير RMSE أسهل وبالتالي يتم استخدامه في كثير من الأحيان.
مصادر إضافية
مقدمة في الانحدار الخطي المتعدد
RMSE مقابل R-Squared: ما هو المقياس الذي يجب عليك استخدامه؟
حاسبة RMSE