Tes kolmogorov-smirnov di r (dengan contoh)


Uji Kolmogorov-Smirnov digunakan untuk menguji apakah suatu sampel berasal dari distribusi tertentu atau tidak.

Untuk melakukan pengujian Kolmogorov-Smirnov satu atau dua sampel di R, kita dapat menggunakan fungsi ks.test() .

Tutorial ini menunjukkan contoh cara menggunakan fitur ini dalam praktik.

Contoh 1: Sampel uji Kolmogorov-Smirnov

Misalkan kita memiliki contoh data berikut:

 #make this example reproducible
seed(0)

#generate dataset of 100 values that follows a Poisson distribution with mean=5
data <- rpois(n= 20 , lambda= 5 )

Terkait: Panduan untuk dpois, ppois, qpois, dan rpois di R

Kode berikut menunjukkan cara melakukan uji Kolmogorov-Smirnov pada sampel 100 nilai data ini untuk menentukan apakah berasal dari distribusi normal:

 #perform Kolmogorov-Smirnov test
ks.test(data, “ pnorm ”)

	One-sample Kolmogorov–Smirnov test

data:data
D = 0.97725, p-value < 2.2e-16
alternative hypothesis: two-sided

Dari hasilnya, kita dapat melihat bahwa statistik uji adalah 0,97725 dan nilai p yang sesuai adalah 2,2e-16 . Karena nilai p kurang dari 0,05, kami menolak hipotesis nol. Kami memiliki cukup bukti untuk mengatakan bahwa data sampel tidak berasal dari distribusi normal.

Hasil ini seharusnya tidak mengejutkan karena kami membuat data sampel menggunakan fungsi rpois() , yang menghasilkan nilai acak yang mengikuti distribusi Poisson .

Contoh 2: Uji Kolmogorov-Smirnov dua sampel

Katakanlah kita memiliki dua contoh kumpulan data berikut:

 #make this example reproducible
seed(0)

#generate two datasets
data1 <- rpois(n= 20 , lambda= 5 )
data2 <- rnorm( 100 )

Kode berikut menunjukkan cara melakukan uji Kolmogorov-Smirnov pada kedua sampel tersebut untuk menentukan apakah keduanya berasal dari distribusi yang sama:

 #perform Kolmogorov-Smirnov test
ks.test(data1, data2)

	Two-sample Kolmogorov–Smirnov test

data: data1 and data2
D = 0.99, p-value = 1.299e-14
alternative hypothesis: two-sided

Dari hasilnya, kita dapat melihat bahwa statistik pengujian adalah 0,99 dan nilai p yang sesuai adalah 1,299e-14 . Karena nilai p kurang dari 0,05, kami menolak hipotesis nol. Kami memiliki cukup bukti untuk mengatakan bahwa kedua kumpulan data sampel tersebut tidak berasal dari distribusi yang sama.

Hasil ini juga tidak mengherankan karena kami menghasilkan nilai untuk sampel pertama menggunakan distribusi Poisson dan nilai untuk sampel kedua menggunakan distribusi normal .

Sumber daya tambahan

Cara melakukan tes Shapiro-Wilk di R
Cara melakukan tes Anderson-Darling di R
Cara melakukan uji normalitas multivariat di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *