كيفية إجراء اختبار نسبة الاحتمالية في r
يقارن اختبار نسبة الاحتمالية مدى ملاءمة نموذجين من نماذج الانحدار المتداخلة.
النموذج المتداخل هو ببساطة نموذج يحتوي على مجموعة فرعية من متغيرات التوقع في نموذج الانحدار الشامل.
على سبيل المثال، لنفترض أن لدينا نموذج الانحدار التالي مع أربعة متغيرات متوقعة:
Y = β 0 + β 1 × 1 + β 2 × 2 + β 3 × 3 + β 4 × 4 + ε
مثال على النموذج المتداخل هو النموذج التالي الذي يحتوي على اثنين فقط من متغيرات التوقع الأصلية:
Y = β 0 + β 1 × 1 + β 2 × 2 + ε
لتحديد ما إذا كان هذان النموذجان مختلفان بشكل كبير، يمكننا إجراء اختبار نسبة الاحتمالية الذي يستخدم الفرضيات الصفرية والبديلة التالية:
H 0 : النموذج الكامل والنموذج المتداخل يتناسبان مع البيانات بشكل متساوٍ. لذلك، يجب عليك استخدام نموذج متداخل .
HA A : النموذج الكامل يناسب البيانات بشكل أفضل بكثير من النموذج المتداخل. لذلك عليك استخدام القالب الكامل .
إذا كانت القيمة p للاختبار أقل من مستوى معين من الأهمية (على سبيل المثال 0.05)، فيمكننا رفض فرضية العدم ونستنتج أن النموذج الكامل يوفر ملاءمة أفضل بكثير.
يوضح المثال التالي كيفية إجراء اختبار نسبة الاحتمالية في R.
مثال: اختبار نسبة الاحتمالية في R
يوضح التعليمة البرمجية التالية كيفية ملاءمة نموذجي الانحدار التاليين في R باستخدام البيانات من مجموعة بيانات mtcars المضمنة:
النموذج الكامل: ميل لكل جالون = β 0 + β 1 متاح + β 2 كربوهيدرات + β 3 حصان + β 4 سيل
الموديل: ميلا في الغالون = β 0 + β 1 متاح + β 2 كربوهيدرات
سنستخدم الدالة lrtest() من الحزمة lmtest لإجراء اختبار نسبة الاحتمالية على هذين النموذجين:
library (lmtest) #fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform likelihood ratio test for differences in models lrtest(model_full, model_reduced) Likelihood ratio test Model 1: mpg ~ disp + carb + hp + cyl Model 2: mpg ~ available + carb #Df LogLik Df Chisq Pr(>Chisq) 1 6 -77.558 2 4 -78.603 -2 2.0902 0.3517
من النتيجة يمكننا أن نرى أن إحصائيات اختبار مربع كاي هي 2.0902 والقيمة p المقابلة هي 0.3517 .
وبما أن هذه القيمة p لا تقل عن 0.05، فسوف نفشل في رفض فرضية العدم.
وهذا يعني أن النموذج الكامل والنموذج المتداخل يتناسبان مع البيانات بشكل متساوٍ. لذلك يجب علينا استخدام النموذج المتداخل، لأن المتغيرات التوقعية الإضافية في النموذج الكامل لا توفر تحسنًا كبيرًا في الملاءمة.
يمكننا بعد ذلك إجراء اختبار نسبة احتمالية آخر لتحديد ما إذا كان النموذج الذي يحتوي على متغير متنبئ واحد يختلف بشكل كبير عن النموذج الذي يحتوي على كلا المتنبئين:
library (lmtest) #fit full model model_full <- lm(mpg ~ disp + carb, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp, data = mtcars) #perform likelihood ratio test for differences in models lrtest(model_full, model_reduced) Likelihood ratio test Model 1: mpg ~ available + carb Model 2: mpg ~ available #Df LogLik Df Chisq Pr(>Chisq) 1 4 -78.603 2 3 -82.105 -1 7.0034 0.008136 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
من النتيجة يمكننا أن نرى أن القيمة p لاختبار نسبة الاحتمال هي 0.008136 . وبما أن هذا الرقم أقل من 0.05 فإننا نرفض الفرضية الصفرية.
وبالتالي، فإننا نستنتج أن نموذج المتنبئين يوفر تحسنا كبيرا في الملاءمة على نموذج المتنبئ الفردي.
وبالتالي فإن نموذجنا النهائي سيكون:
ميل لكل جالون = β 0 + β 1 متاح + β 2 كربوهيدرات
مصادر إضافية
كيفية إجراء الانحدار الخطي البسيط في R
كيفية إجراء الانحدار الخطي المتعدد في R
كيفية تفسير رموز المعنى في R