Cara menguji multikolinearitas di spss
Multikolinearitas dalam analisis regresi terjadi ketika dua atau lebih variabel prediktor berkorelasi tinggi satu sama lain sehingga tidak memberikan informasi yang unik atau independen dalam model regresi. Jika tingkat korelasi antar variabel cukup tinggi, hal ini dapat menimbulkan masalah saat menyesuaikan dan menafsirkan model regresi.
Salah satu cara untuk mendeteksi multikolinearitas adalah dengan menggunakan metrik yang disebut variance inflasi faktor (VIF) , yang mengukur korelasi dan kekuatan korelasi antar variabel prediktor dalam model regresi.
Tutorial ini menjelaskan cara menggunakan VIF untuk mendeteksi multikolinearitas dalam analisis regresi di SPSS.
Contoh: multikolinearitas pada SPSS
Misalkan kita memiliki kumpulan data berikut yang menunjukkan nilai ujian 10 siswa beserta jumlah jam yang mereka habiskan untuk belajar, jumlah ujian praktik yang mereka ambil, dan nilai mereka saat ini dalam kursus tersebut:
Kami ingin melakukan regresi linier menggunakan score sebagai variabel respons dan jam , prep_exams , dan current_grade sebagai variabel prediktor, namun kami ingin memastikan bahwa ketiga variabel prediktor tidak berkorelasi tinggi.
Untuk mengetahui apakah multikolinearitas merupakan masalah, kita dapat menghasilkan nilai VIF untuk masing-masing variabel prediktor.
Untuk melakukan ini, klik pada tab Analisis , lalu Regresi , lalu Linear :
Di jendela baru yang muncul, seret skor ke dalam kotak berlabel Dependent dan seret ketiga variabel prediktor ke dalam kotak berlabel Independen. Lalu klik Statistics dan pastikan kotak dicentang di sebelah Collinearity Diagnostics . Lalu klik Lanjutkan . Lalu klik oke .
Setelah Anda klik OK , maka akan muncul tabel berikut yang menunjukkan nilai VIF untuk setiap variabel prediktor:
Nilai VIF masing-masing variabel prediktor adalah sebagai berikut:
- jam: 1.169
- persiapan_ujian: 1,403
- skor_saat ini: 1,522
Nilai VIF dimulai dari 1 dan tidak memiliki batas atas. Aturan umum untuk menafsirkan VIF adalah:
- Nilai 1 menunjukkan bahwa tidak ada korelasi antara variabel prediktor tertentu dengan variabel prediktor lainnya dalam model.
- Nilai antara 1 dan 5 menunjukkan korelasi sedang antara variabel prediktor tertentu dan variabel prediktor lainnya dalam model, namun seringkali tidak cukup parah sehingga memerlukan perhatian khusus.
- Nilai yang lebih besar dari 5 menunjukkan kemungkinan adanya korelasi yang serius antara variabel prediktor tertentu dan variabel prediktor lainnya dalam model. Dalam hal ini, estimasi koefisien dan nilai p pada hasil regresi kemungkinan besar tidak dapat diandalkan.
Terlihat bahwa nilai VIF variabel prediktor pada contoh ini tidak ada yang lebih besar dari 5, yang menunjukkan bahwa multikolinearitas tidak akan menjadi masalah dalam model regresi.