Heteroskedastisitas

Artikel ini menjelaskan apa itu heteroskedastisitas dalam statistik. Selain itu, Anda juga akan mengetahui apa saja penyebab heteroskedastisitas, apa dampaknya, dan cara mengatasinya.

Apa itu heteroskedastisitas?

Dalam statistika, heteroskedastisitas merupakan suatu ciri yang menyajikan pola regresi yang menyiratkan bahwa varians kesalahan tidak konstan. Dengan kata lain model heteroskedastis artinya kesalahan-kesalahannya mempunyai varian yang tidak beraturan, maka model tersebut disebut heteroskedastis.

Ingatlah bahwa kesalahan (atau sisa) didefinisikan sebagai selisih antara nilai sebenarnya dan nilai yang diperkirakan oleh model regresi.

e_i=y_i-\widehat{y}_i

Saat membangun model regresi, kesalahan yang dibuat oleh setiap observasi dihitung menggunakan ekspresi sebelumnya. Dengan demikian, suatu model statistik dikatakan heteroskedastis apabila varian kesalahan yang dihitung tidak konstan sepanjang pengamatan, melainkan bervariasi.

heteroskedastisitas dan homoskedastisitas

Meskipun kelihatannya sangat sederhana, namun penting agar model regresi tidak menunjukkan heteroskedastisitas, karena perhitungan model didasarkan pada fakta bahwa varians dari residu adalah konstan, bahkan ini adalah salah satu asumsi sebelumnya. model regresi.

Ada uji statistik tertentu yang dapat mendeteksi heteroskedastisitas, seperti uji White atau uji Goldfeld-Quandt. Namun, biasanya dengan membuat grafik residu, heteroskedastisitasnya dapat diidentifikasi.

Penyebab terjadinya heteroskedastisitas

Penyebab paling umum dari heteroskedastisitas dalam suatu model adalah:

  • Ketika rentang data sangat lebar dibandingkan dengan rata-rata. Apabila dalam sampel statistik yang sama terdapat nilai yang sangat besar dan nilai yang sangat kecil, maka kemungkinan besar model regresi yang diperoleh bersifat heteroskedastis.
  • Menghilangkan variabel dalam model regresi juga mengakibatkan terjadinya heteroskedastisitas. Logikanya, jika suatu variabel yang relevan tidak dimasukkan dalam model, maka variasinya akan dimasukkan dalam residu dan hal ini belum tentu tetap.
  • Demikian pula, perubahan struktur dapat menyebabkan model tidak sesuai dengan kumpulan data dan, oleh karena itu, varians dari residu mungkin tidak konstan.
  • Ketika beberapa variabel memiliki nilai yang jauh lebih besar dibandingkan variabel penjelas lainnya, maka model tersebut mungkin mengalami heteroskedastisitas. Dalam hal ini, variabel-variabel tersebut dapat direlatifkan untuk menyelesaikan masalah.

Namun, ada beberapa kasus yang secara alami cenderung menunjukkan heteroskedastisitas. Misalnya, jika kita memodelkan pendapatan seseorang dengan pengeluaran makanannya, maka orang yang lebih kaya mempunyai variabilitas yang jauh lebih besar dalam pengeluaran makanannya dibandingkan orang yang lebih miskin. Karena orang kaya kadang makan di restoran mahal dan kadang di restoran murah, berbeda dengan orang miskin yang selalu makan di restoran murah. Oleh karena itu, model regresi mudah mengalami heteroskedastisitas.

Akibat Heteroskedastisitas

Secara garis besar akibat heteroskedastisitas dalam model regresi adalah sebagai berikut:

  • Efisiensi hilang dalam penduga kuadrat terkecil, yang didefinisikan sebagai rata-rata kuadrat kesalahan.
  • Terjadi kesalahan pada perhitungan matriks kovarians penduga kuadrat terkecil.

Heteroskedastisitas yang benar

Apabila model regresi yang dihasilkan bersifat heteroskedastisitas, maka dapat dilakukan koreksi berikut untuk memperoleh heteroskedastisitas:

  • Hitung logaritma natural dari variabel bebas, hal ini umumnya berguna ketika varians dari residu meningkat dalam grafik.
  • Bergantung pada plot sisa, jenis transformasi variabel independen lain mungkin lebih praktis. Misalnya, jika grafik berbentuk parabola, kita dapat menghitung kuadrat variabel bebas dan menambahkan variabel tersebut ke model.
  • Variabel lain juga dapat digunakan untuk model; dengan menghapus atau menambahkan variabel, varians dari residu dapat diubah.
  • Daripada menggunakan kriteria kuadrat terkecil, kriteria kuadrat terkecil tertimbang dapat digunakan.

Heteroskedastisitas dan homoskedastisitas

Terakhir, kita akan melihat apa saja perbedaan antara heteroskedastisitas dan homoskedastisitas dalam statistik, karena ini adalah dua konsep model regresi yang harus kita pahami dengan jelas.

Homoskedastisitas suatu model regresi merupakan karakteristik statistik yang menunjukkan bahwa varians error adalah konstan. Jadi, model homoskedastik berarti varian kesalahannya adalah konstan.

Perbedaan antara heteroskedastisitas dan homoskedastisitas terletak pada kekonstanan varians dari residu. Jika varians dari residual suatu model tidak konstan berarti model tersebut heteroskedastis. Sebaliknya, jika varians dari residunya konstan, berarti homoskedastik.

Oleh karena itu, kita perlu memastikan bahwa model regresi yang kita bangun bersifat homoskedastis, sehingga asumsi varians dari residualnya konstan akan terpenuhi.

Lihat: Homoskedastisitas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *