Panduan uji kebulatan bartlett
Uji kebulatan Bartlett membandingkan matriks korelasi yang diamati dengan matriks identitas. Pada dasarnya, ini memeriksa apakah ada redundansi antar variabel yang dapat diringkas dengan sejumlah faktor.
Hipotesis nol dari pengujian ini adalah bahwa variabel-variabel tersebut ortogonal, yaitu tidak berkorelasi. Hipotesis alternatifnya adalah variabel-variabel tersebut tidak ortogonal, yaitu cukup berkorelasi hingga matriks korelasi menyimpang secara signifikan dari matriks identitas.
Pengujian ini sering dilakukan sebelum menggunakan teknik reduksi data seperti analisis komponen utama atau analisis faktor untuk memverifikasi bahwa teknik reduksi data benar-benar dapat memampatkan data secara bermakna.
Catatan: Uji kebulatan Bartlett tidak sama dengan uji kesetaraan varians Bartlett . Ini adalah kebingungan umum karena keduanya memiliki nama yang mirip.
Matriks korelasi dan matriks identitas
Matriks korelasi hanyalah matriks nilai yang menunjukkan koefisien korelasi antar variabel. Misalnya, matriks korelasi berikut menunjukkan koefisien korelasi antara berbagai variabel untuk tim bola basket profesional.
Koefisien korelasi dapat bervariasi dari -1 hingga 1. Semakin jauh suatu nilai dari 0, semakin tinggi korelasi antara dua variabel.
Matriks identitas adalah matriks yang semua nilai pada diagonalnya adalah 1 dan semua nilai lainnya adalah 0.
Dalam hal ini, jika angka-angka dalam matriks ini mewakili koefisien korelasi, ini berarti bahwa setiap variabel benar-benar ortogonal (yaitu “tidak berkorelasi”) terhadap semua variabel lainnya dan oleh karena itu teknik reduksi data seperti PCA atau analisis faktor tidak akan mampu “ kompres” data dengan cara yang berarti.
Jadi, alasan kami melakukan uji kebulatan Bartlett adalah untuk memastikan bahwa matriks korelasi variabel-variabel dalam kumpulan data kami menyimpang secara signifikan dari matriks identitas, sehingga kami mengetahui bahwa teknik reduksi data layak digunakan.
Jika nilai p uji kebulatan Bartlett lebih kecil dari tingkat signifikansi yang dipilih (pilihan umum adalah 0,10, 0,05, dan 0,01), maka kumpulan data kami cocok untuk teknik reduksi data.
Cara melakukan uji kebulatan Bartlett di R
Untuk melakukan uji kebulatan Bartlett di R, kita dapat menggunakan fungsi cortest.bartlett() dari perpustakaan psikis . Sintaks umum dari fungsi ini adalah sebagai berikut:
kortes.bartlett(R, n)
- R: matriks korelasi kumpulan data
- n: ukuran sampel kumpulan data
Kode berikut menunjukkan cara melakukan pengujian ini pada kumpulan data palsu yang kami buat:
#make this example reproducible set.seed(0) #create fake data data <- data.frame(A = rnorm(50, 1, 4), B = rnorm(50, 3, 6), C = rnorm(50, 5, 8)) #view first six rows of data head(data) #ABC #1 6.0518171 4.5968242 11.25487348 #2 -0.3049334 0.7397837 -1.21421297 #3 6.3191971 17.6481878 0.07208074 #4 6.0897173 -1.7720347 5.37264242 #5 2.6585657 2.6707352 -4.04308622 #6 -5.1598002 4.5008479 9.61375026 #find correlation matrix of data cor_matrix <- cor(data) #view correlation matrix cor_matrix #ABC #A 1.0000000 0.1600155667 0.2825308511 #B 0.1600156 1.0000000000 0.0005358384 #C 0.2825309 0.0005358384 1.0000000000 #load psych library library(psych) #perform Bartlett's Test of Sphericity cortest.bartlett(cor_matrix, n = nrow(data)) #$chisq #[1] 5.252329 # #$p.value #[1] 0.1542258 # #$df #[1] 3
Statistik uji Chi-square adalah 5,252329 dan nilai p yang sesuai adalah 0,1542258, yang tidak kurang dari tingkat signifikansi kita (kita gunakan 0,05). Oleh karena itu, data ini mungkin tidak cocok untuk PCA atau analisis faktor.
Sederhananya, ketiga variabel dalam kumpulan data kami tidak cukup berkorelasi, sehingga teknik reduksi data seperti PCA atau analisis faktor akan mengalami kesulitan untuk mengompresi variabel-variabel ini menjadi kombinasi linier yang mampu menangkap varians signifikan yang ada dalam data.