ما هو اختبار f الجزئي؟
يتم استخدام اختبار F الجزئي لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين نموذج الانحدار والنسخة المتداخلة من نفس النموذج أم لا.
النموذج المتداخل هو ببساطة نموذج يحتوي على مجموعة فرعية من متغيرات التوقع في نموذج الانحدار الشامل.
على سبيل المثال، لنفترض أن لدينا نموذج الانحدار التالي مع أربعة متغيرات متوقعة:
Y = β 0 + β 1 × 1 + β 2 × 2 + β 3 × 3 + β 4 × 4 + ε
مثال على النموذج المتداخل هو النموذج التالي الذي يحتوي على اثنين فقط من متغيرات التوقع الأصلية:
Y = β 0 + β 1 × 1 + β 2 × 2 + ε
لتحديد ما إذا كان هذان النموذجان مختلفان بشكل كبير، يمكننا إجراء اختبار F جزئي.
اختبار F الجزئي: الأساسيات
يحسب اختبار F الجزئي إحصائية اختبار F التالية:
F = (( RSS مخفض – RSS كامل )/p) / ( RSS كامل /nk)
ذهب:
- RSS المخفض : المجموع المتبقي لمربعات النموذج المخفض (أي “المتداخل”).
- RSS كامل : المجموع المتبقي لمربعات النموذج الكامل.
- p: عدد المتنبئين الذين تمت إزالتهم من النموذج الكامل.
- n: إجمالي عدد الملاحظات في مجموعة البيانات.
- ك: عدد المعاملات (بما في ذلك التقاطع) في النموذج الكامل.
لاحظ أن المجموع المتبقي للمربعات سيكون دائمًا أصغر بالنسبة للنموذج الكامل نظرًا لأن إضافة المتنبئين سيؤدي دائمًا إلى تقليل الخطأ.
لذا فإن اختبار F الجزئي يختبر بشكل أساسي ما إذا كانت مجموعة المتنبئين التي قمت بإزالتها من النموذج الكامل مفيدة بالفعل ويجب تضمينها في النموذج الكامل.
يستخدم هذا الاختبار الفرضيات الصفرية والبديلة التالية:
H 0 : جميع المعاملات المحذوفة من النموذج الكامل هي صفر.
HA A : واحد على الأقل من المعاملات التي تمت إزالتها من النموذج الكامل غير صفر.
إذا كانت القيمة p المقابلة لإحصائيات اختبار F أقل من مستوى معين من الأهمية (على سبيل المثال 0.05)، فيمكننا رفض فرضية العدم ونستنتج أن واحدًا على الأقل من المعاملات التي تمت إزالتها من النموذج الكامل مهم.
اختبار F الجزئي: مثال
عمليًا، نستخدم الخطوات التالية لإجراء اختبار F الجزئي:
1. قم بملاءمة نموذج الانحدار الكامل وحساب RSS بالكامل .
2. قم بملاءمة نموذج الانحدار المتداخل وحساب RSS المخفض .
3. قم بإجراء تحليل التباين (ANOVA) لمقارنة النموذج الكامل والمخفض، والذي سينتج إحصائية اختبار F اللازمة لمقارنة النماذج.
على سبيل المثال، يوضح التعليمة البرمجية التالية كيفية ملاءمة نموذجي الانحدار التاليين في R باستخدام بيانات من مجموعة بيانات mtcars المضمنة:
النموذج الكامل: ميل لكل جالون = β 0 + β 1 متاح + β 2 كربوهيدرات + β 3 حصان + β 4 سيل
الموديل: ميلا في الغالون = β 0 + β 1 متاح + β 2 كربوهيدرات
#fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform ANOVA to test for differences in models anova(model_reduced, model_full) Analysis of Variance Table Model 1: mpg ~ available + carb Model 2: mpg ~ disp + carb + hp + cyl Res.Df RSS Df Sum of Sq F Pr(>F) 1 29 254.82 2 27 238.71 2 16.113 0.9113 0.414
من النتيجة، يمكننا أن نرى أن إحصائيات اختبار F لـ ANOVA هي 0.9113 والقيمة p المقابلة هي 0.414 .
وبما أن هذه القيمة p لا تقل عن 0.05، فسوف نفشل في رفض فرضية العدم. وهذا يعني أنه ليس لدينا ما يكفي من الأدلة لنقول أن أيًا من متغيرات التوقع hp أو cyl له دلالة إحصائية.
بمعنى آخر، إضافة hp و cyl إلى نموذج الانحدار لا يؤدي إلى تحسين ملاءمة النموذج بشكل ملحوظ.