Apa itu bias agregasi? (penjelasan & contoh)
Bias agregasi terjadi ketika tren yang diamati dalam data gabungan secara keliru diasumsikan juga berlaku pada titik data individual.
Cara termudah untuk memahami bias jenis ini adalah dengan mengambil contoh sederhana.
Contoh: bias agregasi
Misalkan peneliti ingin memahami hubungan antara rata-rata lama pendidikan dan rata-rata pendapatan rumah tangga di suatu negara bagian. Mereka memperoleh data gabungan untuk 4 kota berbeda di negara bagian tersebut dan menghitung korelasi antara rata-rata pendidikan dan pendapatan rata-rata rumah tangga.
Ternyata korelasi antara rata-rata lama pendidikan dan rata-rata pendapatan rumah tangga adalah 0,9632 . Ini adalah koefisien korelasi yang sangat positif.
Para peneliti bahkan membuat diagram sebar untuk memvisualisasikan hubungan antara rata-rata lama pendidikan dan rata-rata pendapatan rumah tangga:
Tanpa benar-benar melihat data individu, mereka dapat mengeluarkan laporan yang menyatakan bahwa lamanya pendidikan berkorelasi sangat positif dengan pendapatan rumah tangga.
Namun, misalkan seorang peneliti baru datang satu tahun kemudian dan memperoleh data mengenai masing-masing rumah tangga di kota yang sama. Misalkan dia membuat diagram sebar data berikut:
Ia menghitung korelasi antara kedua variabel dan menemukan bahwa sebenarnya hanya sebesar 0,1788 – masih merupakan korelasi positif, namun tidak sekuat korelasi yang ditemukan oleh peneliti sebelumnya.
Ternyata ketika data tersebut dikumpulkan, data tersebut mencakup tren sebenarnya antara pendidikan dan pendapatan yang terjadi pada tingkat individu.
Faktanya, ketika kita melihat kota demi kota dalam diagram sebar, hubungan antara pendidikan dan pendapatan sebenarnya negatif!
Pengaruh bias agregasi
Bias agregasi cukup sering terjadi dalam penelitian hanya karena sering kali terjadi kesalahan asumsi bahwa tren yang muncul pada tingkat agregat pasti juga muncul pada tingkat individu. Sayangnya, hal ini tidak selalu terjadi, seperti yang ditunjukkan pada contoh sebelumnya.
Bias agregasi dapat menyebabkan hasil penelitian mengambil kesimpulan yang salah dan menyesatkan. Jenis bias ini sangat berbahaya jika menyangkut korelasi antar variabel.
Sekalipun korelasi antara data agregat dua variabel adalah positif, korelasi mendasar antara kedua variabel pada tingkat observasi individual sebenarnya bisa berupa:
- Korelasi negatif
- Tidak ada korelasi
- Korelasi positif
Cara untuk menghindari bias jenis ini adalah dengan melakukan penelitian menggunakan titik data individual, bukan titik data agregat, sehingga Anda dapat menemukan hubungan sebenarnya antara dua variabel.