كيفية إجراء اختبار breusch-pagan في بايثون


في تحليل الانحدار، تشير التغايرية إلى التشتت غير المتساوي للبقايا. وبتعبير أدق، هذه هي الحالة التي يوجد فيها تغيير منهجي في توزيع البقايا على مدى القيم المقاسة.

تعد التغايرية مشكلة لأن انحدار المربعات الصغرى العادية (OLS) يفترض أن البقايا تأتي من مجتمع لديه المثلية ، مما يعني التباين المستمر.

عندما تكون التغايرية موجودة في تحليل الانحدار، يصبح من الصعب تصديق نتائج التحليل.

إحدى الطرق لتحديد ما إذا كانت التغايرية موجودة في تحليل الانحدار هي استخدام اختبار Breusch-Pagan .

يشرح هذا البرنامج التعليمي كيفية إجراء اختبار Breusch-Pagan في لغة Python.

مثال: اختبار Breusch-Pagan في بايثون

في هذا المثال، سنستخدم مجموعة البيانات التالية التي تصف سمات 10 من لاعبي كرة السلة:

 import numpy as np
import pandas as pd

#create dataset
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view dataset
df

	rating points assists rebounds
0 90 25 5 11
1 85 20 7 8
2 82 14 7 10
3 88 16 8 6
4 94 27 5 6
5 90 20 7 9
6 76 12 6 6
7 75 15 9 10
8 87 14 9 10
9 86 19 5 7

سوف نقوم بتركيب نموذج الانحدار الخطي المتعدد باستخدام التسجيل كمتغير الاستجابة والنقاط والتمريرات والمرتدات كمتغيرات توضيحية. بعد ذلك، سنقوم بإجراء اختبار Breusch-Pagan لتحديد ما إذا كانت التغايرية موجودة في الانحدار.

الخطوة 1: ملاءمة نموذج الانحدار الخطي المتعدد.

أولاً، سنطبق نموذج الانحدار الخطي المتعدد:

 import statsmodels.formula.api as smf

#fit regression model
fit = smf.ols('rating ~ points+assists+rebounds', data=df). fit ()

#view model summary
print (fit.summary())

الخطوة 2: إجراء اختبار Breusch-Pagan.

بعد ذلك، سنقوم بإجراء اختبار Breusch-Pagan لتحديد ما إذا كانت التغايرية موجودة أم لا.

 from statsmodels.compat import lzip
import statsmodels.stats.api as sms

#perform Bresuch-Pagan test
names = ['Lagrange multiplier statistic', 'p-value',
        'f-value', 'f p-value']
test = sms.het_breuschpagan(fit.resid, fit.model.exog)

lzip(names, test)

[('Lagrange multiply statistic', 6.003951995818433),
 ('p-value', 0.11141811013399583),
 ('f-value', 3.004944880309618),
 ('f p-value', 0.11663863538255281)]

يستخدم اختبار Breusch-Pagan الفرضيات الصفرية والبديلة التالية:

الفرضية الصفرية (H 0 ): وجود المثلية.

الفرضية البديلة: (Ha): التجانس غير موجود (أي التباين موجود)

في هذا المثال، إحصائية مضاعف لاغرانج للاختبار هي 6.004 والقيمة الاحتمالية المقابلة هي 0.1114 . وبما أن هذه القيمة p لا تقل عن 0.05، فإننا نفشل في رفض فرضية العدم. ليس لدينا أدلة كافية للادعاء بوجود التغايرية في نموذج الانحدار.

كيفية إصلاح التغايرية

في المثال السابق، رأينا أن التغايرية لم تكن موجودة في نموذج الانحدار.

ومع ذلك، عندما تكون التغايرية موجودة بالفعل، هناك ثلاث طرق شائعة لعلاج الموقف:

1. تحويل المتغير التابع. إحدى الطرق لتصحيح التغايرية هي تحويل المتغير التابع بطريقة ما. التحويل الشائع هو ببساطة أخذ سجل المتغير التابع.

2. إعادة تعريف المتغير التابع. هناك طريقة أخرى لتصحيح التغايرية وهي إعادة تعريف المتغير التابع. إحدى الطرق الشائعة للقيام بذلك هي استخدام معدل للمتغير التابع، بدلاً من القيمة الأولية.

3. استخدم الانحدار المرجح. هناك طريقة أخرى لتصحيح التغايرية وهي استخدام الانحدار المرجح. يقوم هذا النوع من الانحدار بتعيين وزن لكل نقطة بيانات بناءً على تباين قيمتها المجهزة. عند استخدام الأوزان المناسبة، يمكن أن يؤدي ذلك إلى القضاء على مشكلة التغايرية.

اقرأ المزيد من التفاصيل حول كل من هذه الطرق الثلاثة في هذه المقالة .

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *