Cara melakukan uji normalitas multivariat di r


Saat kita ingin menguji apakah suatu variabel terdistribusi normal atau tidak, kita dapat membuat plot QQ untuk memvisualisasikan distribusinya atau melakukan uji statistik formal sepertiuji Anderson Darling atau uji Jarque-Bera .

Namun, ketika kita ingin menguji apakah beberapa variabel terdistribusi normal sebagai suatu kelompok, kita perlu melakukan uji normalitas multivariat .

Tutorial ini menjelaskan cara melakukan uji normalitas multivariat berikut untuk kumpulan data tertentu di R:

  • ujian Mardia
  • Tes energi
  • Tes kurtosis dan skewness multivariat

Terkait: Jika kita ingin mengidentifikasi outlier dalam konteks multivariat, kita dapat menggunakan jarak Mahalanobis .

Contoh : Uji Mardia pada R

Uji Mardia menentukan apakah suatu kelompok variabel mengikuti distribusi normal multivariat atau tidak. Hipotesis nol dan alternatif dari pengujian tersebut adalah sebagai berikut:

H 0 (null): Variabel mengikuti distribusi normal multivariat.

H a (alternatif): Variabel tidak mengikuti distribusi normal multivariat.

Kode berikut menunjukkan cara melakukan pengujian ini di R menggunakan paket QuantPsyc :

 library (QuantPsyc)

#create dataset
set.seed(0)

data <- data.frame(x1 = rnorm(50),
                   x2 = rnorm(50),
                   x3 = rnorm(50))

#perform Multivariate normality test
mult.norm(data)$ mult.test

Beta-hat kappa p-val
Skewness 1.630474 13.5872843 0.1926626
Kurtosis 13.895364 -0.7130395 0.4758213

Fungsi mult.norm() menguji normalitas multivariat pada kemiringan dan kurtosis kumpulan data. Karena kedua nilai p tidak kurang dari 0,05, kami gagal menolak hipotesis nol dari pengujian tersebut. Kami tidak memiliki bukti bahwa ketiga variabel dalam kumpulan data kami tidak mengikuti distribusi multivariat.

Contoh: uji energi di R

Uji energi adalah uji statistik lain yang menentukan apakah sekelompok variabel mengikuti distribusi normal multivariat atau tidak. Hipotesis nol dan alternatif dari pengujian tersebut adalah sebagai berikut:

H 0 (null): Variabel mengikuti distribusi normal multivariat.

H a (alternatif): Variabel tidak mengikuti distribusi normal multivariat.

Kode berikut menunjukkan cara melakukan pengujian ini di R menggunakan paket energi :

 library (energy)

#create dataset
set.seed(0)

data <- data.frame(x1 = rnorm(50),
                   x2 = rnorm(50),
                   x3 = rnorm(50))

#perform Multivariate normality test
mvnorm.etest(data, R= 100 )

Energy test of multivariate normality: estimated parameters

data: x, sample size 50, dimension 3, replicates 100
E-statistic = 0.90923, p-value = 0.31

Nilai p dari tes ini adalah 0,31 . Karena angka ini tidak kurang dari 0,05, kami gagal menolak hipotesis nol pengujian tersebut. Kami tidak memiliki bukti bahwa ketiga variabel dalam kumpulan data kami tidak mengikuti distribusi multivariat.

Catatan: Argumen R=100 menentukan 100 replika yang dipetakan peningkatan untuk digunakan saat menjalankan pengujian. Untuk kumpulan data dengan ukuran sampel yang lebih kecil, Anda dapat meningkatkan jumlah ini untuk menghasilkan estimasi statistik pengujian yang lebih andal.

Sumber daya tambahan

Cara membuat dan menafsirkan plot QQ di R
Cara melakukan tes Anderson-Darling di R
Cara melakukan tes Jarque-Bera di R
Cara melakukan tes Shapiro-Wilk di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *