Apa asumsi varians yang sama dalam statistik?


Banyak uji statistik yang membuat asumsi varians yang sama . Jika asumsi ini tidak dipenuhi, hasil tes menjadi tidak dapat diandalkan.

Uji dan prosedur statistik yang paling umum digunakan untuk membuat asumsi variansi yang sama meliputi:

1. ANOVA

2. uji-t

3. Regresi linier

Tutorial ini menjelaskan asumsi yang dibuat untuk setiap pengujian, cara menentukan apakah asumsi tersebut terpenuhi, dan apa yang harus dilakukan jika asumsi tersebut dilanggar.

Asumsi persamaan varians dalam ANOVA

ANOVA (“Analisis Varians”) digunakan untuk menentukan apakah terdapat perbedaan yang signifikan antara rata-rata tiga atau lebih kelompok independen.

Berikut adalah contoh kapan kita bisa menggunakan ANOVA:

Katakanlah kita merekrut 90 orang untuk berpartisipasi dalam eksperimen penurunan berat badan. Kami secara acak menugaskan 30 orang untuk menggunakan program A, B, atau C selama sebulan.

Untuk melihat apakah program berdampak pada penurunan berat badan, kita dapat melakukan ANOVA satu arah .

ANOVA mengasumsikan bahwa masing-masing kelompok mempunyai varian yang sama. Ada dua cara untuk menguji apakah hipotesis ini benar:

1. Buat plot kotak.

Boxplot memberikan cara visual untuk memverifikasi asumsi kesetaraan varians.

Variasi penurunan berat badan pada masing-masing kelompok dapat diamati dari panjang setiap boxplot. Semakin panjang kotaknya, semakin tinggi variansnya. Misalnya, kita dapat melihat bahwa variansnya sedikit lebih tinggi pada peserta Program C dibandingkan dengan Program A dan Program B.

2. Lakukan tes Bartlett.

Uji Bartlett menguji hipotesis nol bahwa sampel mempunyai varians yang sama terhadap hipotesis alternatif bahwa sampel tidak mempunyai varians yang sama.

Jika nilai p pengujian berada di bawah tingkat signifikansi tertentu (misalnya 0,05), maka kita mempunyai bukti bahwa tidak semua sampel mempunyai varian yang sama.

Apa yang terjadi jika asumsi variansi yang sama tidak terpenuhi?

Secara umum, ANOVA dianggap cukup kuat terhadap pelanggaran asumsi variansi yang sama selama masing-masing kelompok memiliki ukuran sampel yang sama.

Namun, jika ukuran sampel tidak sama dan asumsi ini sangat dilanggar, Anda dapat menjalankan uji Kruskal-Wallis , yang merupakan versi non-parametrik dari ANOVA satu arah.

Asumsi varians yang sama dalam uji-t

Uji-t dua sampel digunakan untuk menguji apakah rata-rata dua populasi sama atau tidak.

Pengujian ini mengasumsikan bahwa varians antara kedua kelompok adalah sama. Ada dua cara untuk menguji apakah hipotesis ini benar:

1. Gunakan aturan praktis rasio.

Secara umum, jika rasio varians terbesar dan varians terkecil kurang dari 4, maka kita dapat mengasumsikan bahwa varians tersebut kira-kira sama dan menggunakan uji-t dua sampel.

Misalnya, sampel 1 memiliki varians 24,5 dan sampel 2 memiliki varians 15,2. Rasio varians sampel terbesar terhadap varians sampel terkecil dihitung sebagai: 24,5 / 15,2 = 1,61.

Karena rasio ini kurang dari 4, maka dapat diasumsikan bahwa perbedaan antara kedua kelompok kira-kira sama.

2. Lakukan uji F.

Uji F menguji hipotesis nol bahwa sampel mempunyai varians yang sama terhadap hipotesis alternatif bahwa sampel tidak mempunyai varians yang sama.

Jika nilai p pengujian berada di bawah tingkat signifikansi tertentu (misalnya 0,05), maka kita mempunyai bukti bahwa tidak semua sampel mempunyai varian yang sama.

Apa yang terjadi jika asumsi variansi yang sama tidak terpenuhi?

Jika asumsi ini dilanggar, maka kita dapat melakukan uji-t Welch , yang merupakan versi non-parametrik dari uji-t dua sampel dan tidak mengasumsikan bahwa kedua sampel mempunyai varian yang sama.

Asumsi Varians yang Sama dalam Regresi Linier

Regresi linier digunakan untuk mengukur hubungan antara satu atau lebih variabel prediktor dan variabel respon.

Regresi linier mengasumsikan bahwa residu memiliki varian yang konstan pada setiap tingkat variabel prediktor. Hal ini disebut homoskedastisitas . Jika hal ini tidak terjadi, maka residu akan mengalami heteroskedastisitas dan hasil analisis regresi menjadi tidak dapat diandalkan.

Cara paling umum untuk menentukan apakah asumsi ini terpenuhi adalah dengan membuat plot residu versus nilai yang sesuai. Jika residu pada grafik ini tampak tersebar secara acak di sekitar nol, maka asumsi homoskedastisitas mungkin terpenuhi.

Namun, jika terdapat tren sistematis pada residu, seperti bentuk “kerucut” pada grafik berikut, maka heteroskedastisitas menjadi masalah:

Apa yang terjadi jika asumsi variansi yang sama tidak terpenuhi?

Jika asumsi ini dilanggar, cara paling umum untuk menyelesaikan masalah adalah dengan mentransformasikan variabel respon menggunakan salah satu dari tiga transformasi:

1. Transformasi log: ubah variabel respons dari y menjadi log(y) .

2. Transformasi akar kuadrat: Transformasikan variabel respon dari y menjadi √y .

3. Transformasi akar pangkat tiga: ubah variabel respon dari y menjadi y 1/3 .

Dengan melakukan transformasi tersebut, masalah heteroskedastisitas secara umum akan hilang.

Cara lain untuk mengoreksi heteroskedastisitas adalah dengan menggunakan regresi kuadrat terkecil tertimbang . Jenis regresi ini memberikan bobot pada setiap titik data berdasarkan varians dari nilai yang dipasang.

Pada dasarnya, hal ini memberikan bobot rendah pada titik data yang memiliki varian lebih tinggi, sehingga mengurangi kuadrat residunya. Jika bobot yang digunakan sesuai maka masalah heteroskedastisitas dapat dihilangkan.

Sumber daya tambahan

Ketiga hipotesis dirumuskan dalam ANOVA
Keempat hipotesis dirumuskan dalam uji T
Empat asumsi regresi linier

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *