ما هي إحصائية الصحافة؟
في الإحصائيات، نلائم نماذج الانحدار لسببين:
(1) اشرح العلاقة بين واحد أو أكثر من المتغيرات التوضيحية ومتغير الاستجابة .
(2) التنبؤ بقيم متغير الاستجابة بناء على قيم متغير تفسيري واحد أو أكثر.
عندما يكون هدفنا هو (2) التنبؤ بقيم متغير الاستجابة، فإننا نريد التأكد من أننا نستخدم أفضل نموذج انحدار ممكن للقيام بذلك.
أحد المقاييس التي يمكننا استخدامها للعثور على نموذج الانحدار الذي من شأنه أن يقدم أفضل التنبؤات بشأن البيانات الجديدة هو إحصاء PRESS ، والذي يرمز إلى ” المجموع المتبقي المتوقع للمربعات “.
يتم حسابه على النحو التالي:
اضغط = Σ(e i / (1-h ii )) 2
ذهب:
- e i : البقايا i.
- hii : مقياس التأثير (ويسمى أيضًا “الرافعة المالية”) للملاحظة الأولى على مدى ملاءمة النموذج.
نظرًا لنماذج الانحدار المتعددة، يجب اختيار النموذج الذي يحتوي على أقل قيمة PRESS باعتباره النموذج الذي سيحقق أفضل أداء في مجموعة بيانات جديدة.
يوضح المثال التالي كيفية حساب إحصائيات PRESS لثلاثة نماذج انحدار خطي مختلفة في R.
مثال: حساب إحصائية PRESS
لنفترض أن لدينا مجموعة بيانات تحتوي على ثلاثة متغيرات توضيحية، x1 و x2 و x3 ، ومتغير الاستجابة y:
data <- data.frame (x1 = c(2, 3, 3, 4, 4, 6, 8, 9, 9, 9),
x2 = c(2, 2, 3, 3, 2, 3, 5, 6, 6, 7),
x3 = c(12, 14, 14, 13, 8, 8, 9, 14, 11, 7),
y = c(23, 24, 15, 9, 14, 17, 22, 26, 34, 35))
يوضح التعليمة البرمجية التالية كيفية ملاءمة ثلاثة نماذج انحدار مختلفة لمجموعة البيانات هذه باستخدام الدالة lm() :
model1 <- lm(y~x1, data=data) model2 <- lm(y~x1+x2, data=data) model3 <- lm(y~x2+x3, data=data)
يوضح الكود التالي كيفية حساب إحصائيات PRESS لكل نموذج.
#create custom function to calculate the PRESS statistic PRESS <- function (model) { i <- residuals (model)/(1 - lm. influence (model)$ hat ) sum(i^2) } #calculate PRESS for model 1 PRESS(model1) [1] 590.2197 #calculate PRESS for model 2 PRESS(model2) [1] 519.6435 #calculate PRESS for model 3 PRESS(model3) [1] 537.7503
وتبين أن النموذج الذي يحتوي على أقل إحصائية PRESS هو النموذج 2 مع إحصائية PRESS تبلغ 519.6435 . وبالتالي، فإننا نختار هذا النموذج باعتباره الأنسب للتنبؤ بمجموعة بيانات جديدة.
مصادر إضافية
مقدمة إلى الانحدار الخطي البسيط
ما هو النموذج البخيل؟
ما هي قيمة R-squared الجيدة؟