Variabel instrumental: definisi & contoh


Seringkali, dalam statistik, kita berusaha memperkirakan pengaruh satu variabel terhadap variabel lainnya. Misalnya, kita mungkin ingin mengetahui:

  • Bagaimana pengaruh waktu belajar terhadap nilai ujian?
  • Bagaimana pengaruh obat tertentu terhadap tekanan darah?
  • Bagaimana stres mempengaruhi detak jantung?

Dalam setiap skenario, kami ingin memahami apakah variabel prediktor memengaruhi variabel respons atau tidak. Namun seringkali terdapat variabel lain yang mempengaruhi hubungan kedua variabel tersebut.

Misalnya kita menggunakan obat tertentu sebagai variabel prediktor dan tekanan darah sebagai variabel respon. Kami hanya tertarik pada efek obat pada tekanan darah:

Namun, variabel lain seperti waktu yang dihabiskan untuk berolahraga, pola makan umum, dan tingkat stres juga mempengaruhi tekanan darah:

Jadi, jika kita melakukan regresi linier sederhana dengan menggunakan obat sebagai variabel prediktor dan tekanan darah sebagai variabel respon, kita tidak dapat yakin bahwa koefisien regresi akan secara akurat menangkap pengaruh obat terhadap tekanan darah, karena faktor eksternal (olahraga, pola makan, stres, dll.) juga bisa berperan.

Salah satu cara potensial untuk mengatasi masalah ini adalah dengan menggunakan variabel instrumental .

Apa yang dimaksud dengan variabel instrumental?

Variabel instrumental adalah variabel ketiga yang dimasukkan ke dalam analisis regresi yang berkorelasi dengan variabel prediktor, tetapi tidak berkorelasi dengan variabel respon. Dengan menggunakan variabel ini, dimungkinkan untuk memperkirakan pengaruh kausal sebenarnya yang dimiliki variabel prediktor terhadap variabel respons.

Misalnya, kita ingin memperkirakan pengaruh obat tertentu terhadap tekanan darah:

Contoh variabel instrumental yang dapat kita gunakan dalam analisis regresi ini adalah kedekatan individu dengan apotek.

Variabel “kedekatan” ini kemungkinan besar akan sangat berkorelasi dengan apakah seseorang meminum obat tersebut atau tidak, karena seseorang tidak akan bisa mendapatkannya jika dia tidak tinggal di dekat apotek.

Namun, variabel “kedekatan” seharusnya tidak memiliki korelasi dengan tekanan darah. Satu-satunya hubungan dengan tekanan darah adalah melalui variabel prediktor.

Variabel instrumental

Cara kita sebenarnya menggunakan variabel instrumental adalah dengan melakukan regresi variabel instrumental, terkadang disebut regresi kuadrat terkecil dua tahap .

Regresi variabel instrumental

Regresi variabel instrumental (atau regresi kuadrat terkecil dua tahap) menggunakan pendekatan berikut untuk memperkirakan pengaruh variabel prediktor terhadap variabel respons:

Langkah 1: Sesuaikan model regresi dengan menggunakan variabel instrumental sebagai variabel prediktor.

Dalam contoh spesifik kami, pertama-tama kami akan menyesuaikan model regresi berikut:

Obat-obatan tertentu = B 0 + B 1 (kedekatan)

Kita kemudian akan mendapatkan nilai prediksi untuk obat-obatan tertentu (cd), yang kita sebut cd hat .

Langkah 2: Pasangkan model regresi kedua menggunakan nilai prediksi cd hat .

Selanjutnya, kita akan menyesuaikan model regresi berikut:

Tekanan darah = B 0 + B 1 (cd topi )

Jika koefisien regresi cd hat signifikan secara statistik, maka kita dapat mengatakan bahwa terdapat efek kausal obat terhadap tekanan darah.

Alasan kami mengatakan ini adalah karena kami hanya menggunakan istilah “kedekatan” untuk membuat CD Hat dan kami tahu bahwa kedekatan tidak boleh berkorelasi dengan tekanan darah, korelasi signifikan apa pun dalam regresi tahap kedua mungkin disebabkan oleh obat tertentu.

Tindakan pencegahan mengenai penggunaan variabel instrumental

Variabel instrumental hanya boleh digunakan jika memenuhi kriteria berikut:

  • Hal ini berkorelasi kuat dengan variabel prediktif.
  • Hal ini tidak berkorelasi dengan variabel respon.
  • Hal ini tidak berkorelasi dengan variabel lain yang dikecualikan dari model (misalnya, kedekatan tidak berkorelasi dengan olahraga, pola makan, atau stres).

Jika suatu variabel instrumental tidak memenuhi kriteria ini, maka variabel tersebut tidak boleh digunakan dalam model regresi karena kemungkinan besar akan memberikan hasil yang tidak dapat diandalkan dan bias.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *