Cara melakukan tes breusch-pagan dengan python


Dalam analisis regresi, heteroskedastisitas mengacu pada penyebaran residu yang tidak merata. Lebih tepatnya, hal ini terjadi ketika terdapat perubahan sistematis dalam distribusi residu pada rentang nilai terukur.

Heteroskedastisitas menjadi masalah karena regresi kuadrat terkecil biasa (OLS) mengasumsikan bahwa residu berasal dari populasi yang homoskedastisitas , artinya variansnya konstan.

Ketika terdapat heteroskedastisitas dalam analisis regresi, hasil analisis menjadi sulit dipercaya.

Salah satu cara untuk mengetahui apakah terdapat heteroskedastisitas dalam analisis regresi adalah dengan menggunakan uji Breusch-Pagan .

Tutorial ini menjelaskan cara melakukan tes Breusch-Pagan dengan Python.

Contoh: Tes Breusch-Pagan dengan Python

Untuk contoh ini, kita akan menggunakan dataset berikut yang mendeskripsikan atribut 10 pemain bola basket:

 import numpy as np
import pandas as pd

#create dataset
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view dataset
df

	rating points assists rebounds
0 90 25 5 11
1 85 20 7 8
2 82 14 7 10
3 88 16 8 6
4 94 27 5 6
5 90 20 7 9
6 76 12 6 6
7 75 15 9 10
8 87 14 9 10
9 86 19 5 7

Kami akan menyesuaikan model regresi linier berganda dengan menggunakan penilaian sebagai variabel respons dan poin, assist, dan rebound sebagai variabel penjelas. Selanjutnya akan dilakukan uji Breusch-Pagan untuk mengetahui apakah terdapat heteroskedastisitas dalam regresi.

Langkah 1: Sesuaikan model regresi linier berganda.

Pertama, kita akan menyesuaikan model regresi linier berganda:

 import statsmodels.formula.api as smf

#fit regression model
fit = smf.ols('rating ~ points+assists+rebounds', data=df). fit ()

#view model summary
print (fit.summary())

Langkah 2: Lakukan tes Breusch-Pagan.

Selanjutnya dilakukan uji Breusch-Pagan untuk mengetahui adanya heteroskedastisitas.

 from statsmodels.compat import lzip
import statsmodels.stats.api as sms

#perform Bresuch-Pagan test
names = ['Lagrange multiplier statistic', 'p-value',
        'f-value', 'f p-value']
test = sms.het_breuschpagan(fit.resid, fit.model.exog)

lzip(names, test)

[('Lagrange multiply statistic', 6.003951995818433),
 ('p-value', 0.11141811013399583),
 ('f-value', 3.004944880309618),
 ('f p-value', 0.11663863538255281)]

Tes Breusch-Pagan menggunakan hipotesis nol dan alternatif berikut:

Hipotesis nol (H 0 ): Ada homoskedastisitas.

Hipotesis alternatif: (Ha): tidak ada homoskedastisitas (yaitu ada heteroskedastisitas)

Dalam contoh ini, statistik pengali Lagrange untuk pengujian ini adalah 6,004 dan nilai p yang sesuai adalah 0,1114 . Karena nilai p ini tidak kurang dari 0,05, kita gagal menolak hipotesis nol. Kami tidak memiliki cukup bukti untuk menyatakan bahwa terdapat heteroskedastisitas dalam model regresi.

Cara Memperbaiki Heteroskedastisitas

Pada contoh sebelumnya, kita melihat bahwa tidak terdapat heteroskedastisitas dalam model regresi.

Namun, ketika heteroskedastisitas memang terjadi, ada tiga cara umum untuk memperbaiki situasi tersebut:

1. Transformasikan variabel terikat. Salah satu cara untuk mengoreksi heteroskedastisitas adalah dengan mentransformasikan variabel terikat dalam beberapa cara. Transformasi yang umum dilakukan adalah dengan mengambil log variabel terikat.

2. Definisikan kembali variabel terikat. Cara lain untuk memperbaiki heteroskedastisitas adalah dengan mendefinisikan kembali variabel terikat. Cara umum untuk melakukan hal ini adalah dengan menggunakan tarif untuk variabel terikat, bukan nilai mentahnya.

3. Gunakan regresi tertimbang. Cara lain untuk mengoreksi heteroskedastisitas adalah dengan menggunakan regresi tertimbang. Jenis regresi ini memberikan bobot pada setiap titik data berdasarkan varians dari nilai yang dipasang. Apabila bobot yang digunakan sesuai maka masalah heteroskedastisitas dapat dihilangkan.

Baca lebih detail mengenai masing-masing ketiga metode tersebut di artikel ini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *