كيفية إجراء اختبار breusch-pagan في بايثون
في تحليل الانحدار، تشير التغايرية إلى التشتت غير المتساوي للبقايا. وبتعبير أدق، هذه هي الحالة التي يوجد فيها تغيير منهجي في توزيع البقايا على مدى القيم المقاسة.
تعد التغايرية مشكلة لأن انحدار المربعات الصغرى العادية (OLS) يفترض أن البقايا تأتي من مجتمع لديه المثلية ، مما يعني التباين المستمر.
عندما تكون التغايرية موجودة في تحليل الانحدار، يصبح من الصعب تصديق نتائج التحليل.
إحدى الطرق لتحديد ما إذا كانت التغايرية موجودة في تحليل الانحدار هي استخدام اختبار Breusch-Pagan .
يشرح هذا البرنامج التعليمي كيفية إجراء اختبار Breusch-Pagan في لغة Python.
مثال: اختبار Breusch-Pagan في بايثون
في هذا المثال، سنستخدم مجموعة البيانات التالية التي تصف سمات 10 من لاعبي كرة السلة:
import numpy as np import pandas as pd #create dataset df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view dataset df rating points assists rebounds 0 90 25 5 11 1 85 20 7 8 2 82 14 7 10 3 88 16 8 6 4 94 27 5 6 5 90 20 7 9 6 76 12 6 6 7 75 15 9 10 8 87 14 9 10 9 86 19 5 7
سوف نقوم بتركيب نموذج الانحدار الخطي المتعدد باستخدام التسجيل كمتغير الاستجابة والنقاط والتمريرات والمرتدات كمتغيرات توضيحية. بعد ذلك، سنقوم بإجراء اختبار Breusch-Pagan لتحديد ما إذا كانت التغايرية موجودة في الانحدار.
الخطوة 1: ملاءمة نموذج الانحدار الخطي المتعدد.
أولاً، سنطبق نموذج الانحدار الخطي المتعدد:
import statsmodels.formula.api as smf #fit regression model fit = smf.ols('rating ~ points+assists+rebounds', data=df). fit () #view model summary print (fit.summary())
الخطوة 2: إجراء اختبار Breusch-Pagan.
بعد ذلك، سنقوم بإجراء اختبار Breusch-Pagan لتحديد ما إذا كانت التغايرية موجودة أم لا.
from statsmodels.compat import lzip import statsmodels.stats.api as sms #perform Bresuch-Pagan test names = ['Lagrange multiplier statistic', 'p-value', 'f-value', 'f p-value'] test = sms.het_breuschpagan(fit.resid, fit.model.exog) lzip(names, test) [('Lagrange multiply statistic', 6.003951995818433), ('p-value', 0.11141811013399583), ('f-value', 3.004944880309618), ('f p-value', 0.11663863538255281)]
يستخدم اختبار Breusch-Pagan الفرضيات الصفرية والبديلة التالية:
الفرضية الصفرية (H 0 ): وجود المثلية.
الفرضية البديلة: (Ha): التجانس غير موجود (أي التباين موجود)
في هذا المثال، إحصائية مضاعف لاغرانج للاختبار هي 6.004 والقيمة الاحتمالية المقابلة هي 0.1114 . وبما أن هذه القيمة p لا تقل عن 0.05، فإننا نفشل في رفض فرضية العدم. ليس لدينا أدلة كافية للادعاء بوجود التغايرية في نموذج الانحدار.
كيفية إصلاح التغايرية
في المثال السابق، رأينا أن التغايرية لم تكن موجودة في نموذج الانحدار.
ومع ذلك، عندما تكون التغايرية موجودة بالفعل، هناك ثلاث طرق شائعة لعلاج الموقف:
1. تحويل المتغير التابع. إحدى الطرق لتصحيح التغايرية هي تحويل المتغير التابع بطريقة ما. التحويل الشائع هو ببساطة أخذ سجل المتغير التابع.
2. إعادة تعريف المتغير التابع. هناك طريقة أخرى لتصحيح التغايرية وهي إعادة تعريف المتغير التابع. إحدى الطرق الشائعة للقيام بذلك هي استخدام معدل للمتغير التابع، بدلاً من القيمة الأولية.
3. استخدم الانحدار المرجح. هناك طريقة أخرى لتصحيح التغايرية وهي استخدام الانحدار المرجح. يقوم هذا النوع من الانحدار بتعيين وزن لكل نقطة بيانات بناءً على تباين قيمتها المجهزة. عند استخدام الأوزان المناسبة، يمكن أن يؤدي ذلك إلى القضاء على مشكلة التغايرية.
اقرأ المزيد من التفاصيل حول كل من هذه الطرق الثلاثة في هذه المقالة .