كيفية حساب مجموع المربعات المتبقية في بايثون
المتبقي هو الفرق بين القيمة المرصودة والقيمة المتوقعة في نموذج الانحدار.
يتم حسابه على النحو التالي:
المتبقية = القيمة المرصودة – القيمة المتوقعة
إحدى الطرق لفهم مدى ملاءمة نموذج الانحدار لمجموعة بيانات هي حساب مجموع المربعات المتبقية ، والذي يتم حسابه على النحو التالي:
مجموع المربعات المتبقية = Σ(e i ) 2
ذهب:
- Σ : رمز يوناني معناه “المجموع”
- e i : البقايا i
كلما انخفضت القيمة، كان النموذج مناسبًا لمجموعة البيانات بشكل أفضل.
يقدم هذا البرنامج التعليمي مثالاً خطوة بخطوة لكيفية حساب مجموع المربعات المتبقية لنموذج الانحدار في بايثون.
الخطوة 1: أدخل البيانات
في هذا المثال، سنقوم بإدخال البيانات المتعلقة بعدد الساعات التي قضاها في الدراسة، وإجمالي عدد الاختبارات التحضيرية التي تم إجراؤها، ونتائج الامتحانات التي حصل عليها 14 طالبًا مختلفًا:
import pandas as pd #createDataFrame df = pd. DataFrame ({' hours ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5], ' exams ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4], ' score ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90]})
الخطوة 2: تناسب نموذج الانحدار
بعد ذلك، سوف نستخدم الدالة OLS() من مكتبة statsmodels لإجراء انحدار عادي بالمربعات الصغرى، باستخدام “الساعات” و”الامتحانات” كمتغيرات متوقعة و”النتيجة” كمتغير الاستجابة:
import statsmodels. api as sm
#define response variable
y = df[' score ']
#define predictor variables
x = df[[' hours ', ' exams ']]
#add constant to predictor variables
x = sm. add_constant (x)
#fit linear regression model
model = sm. OLS (y,x). fit ()
#view model summary
print ( model.summary ())
OLS Regression Results
==================================================== ============================
Dept. Variable: R-squared score: 0.722
Model: OLS Adj. R-squared: 0.671
Method: Least Squares F-statistic: 14.27
Date: Sat, 02 Jan 2021 Prob (F-statistic): 0.000878
Time: 15:58:35 Log-Likelihood: -41.159
No. Comments: 14 AIC: 88.32
Df Residuals: 11 BIC: 90.24
Model: 2
Covariance Type: non-robust
==================================================== ============================
coef std err t P>|t| [0.025 0.975]
-------------------------------------------------- ----------------------------
const 71.8144 3.680 19.517 0.000 63.716 79.913
hours 5.0318 0.942 5.339 0.000 2.958 7.106
exams -1.3186 1.063 -1.240 0.241 -3.658 1.021
==================================================== ============================
Omnibus: 0.976 Durbin-Watson: 1.270
Prob(Omnibus): 0.614 Jarque-Bera (JB): 0.757
Skew: -0.245 Prob(JB): 0.685
Kurtosis: 1.971 Cond. No. 12.1
==================================================== ============================
الخطوة 3: حساب مجموع المربعات المتبقية
يمكننا استخدام الكود التالي لحساب المجموع المتبقي لمربعات النموذج:
print ( model.ssr )
293.25612951525414
تبين أن مجموع المربعات المتبقية هو 293,256 .
مصادر إضافية
كيفية إجراء الانحدار الخطي البسيط في بايثون
كيفية إجراء الانحدار الخطي المتعدد في بايثون
المبلغ المتبقي من حاسبة المربعات