Tes kolmogorov-smirnov di r (dengan contoh)
Uji Kolmogorov-Smirnov digunakan untuk menguji apakah suatu sampel berasal dari distribusi tertentu atau tidak.
Untuk melakukan pengujian Kolmogorov-Smirnov satu atau dua sampel di R, kita dapat menggunakan fungsi ks.test() .
Tutorial ini menunjukkan contoh cara menggunakan fitur ini dalam praktik.
Contoh 1: Sampel uji Kolmogorov-Smirnov
Misalkan kita memiliki contoh data berikut:
#make this example reproducible seed(0) #generate dataset of 100 values that follows a Poisson distribution with mean=5 data <- rpois(n= 20 , lambda= 5 )
Terkait: Panduan untuk dpois, ppois, qpois, dan rpois di R
Kode berikut menunjukkan cara melakukan uji Kolmogorov-Smirnov pada sampel 100 nilai data ini untuk menentukan apakah berasal dari distribusi normal:
#perform Kolmogorov-Smirnov test ks.test(data, “ pnorm ”) One-sample Kolmogorov–Smirnov test data:data D = 0.97725, p-value < 2.2e-16 alternative hypothesis: two-sided
Dari hasilnya, kita dapat melihat bahwa statistik uji adalah 0,97725 dan nilai p yang sesuai adalah 2,2e-16 . Karena nilai p kurang dari 0,05, kami menolak hipotesis nol. Kami memiliki cukup bukti untuk mengatakan bahwa data sampel tidak berasal dari distribusi normal.
Hasil ini seharusnya tidak mengejutkan karena kami membuat data sampel menggunakan fungsi rpois() , yang menghasilkan nilai acak yang mengikuti distribusi Poisson .
Contoh 2: Uji Kolmogorov-Smirnov dua sampel
Katakanlah kita memiliki dua contoh kumpulan data berikut:
#make this example reproducible seed(0) #generate two datasets data1 <- rpois(n= 20 , lambda= 5 ) data2 <- rnorm( 100 )
Kode berikut menunjukkan cara melakukan uji Kolmogorov-Smirnov pada kedua sampel tersebut untuk menentukan apakah keduanya berasal dari distribusi yang sama:
#perform Kolmogorov-Smirnov test
ks.test(data1, data2)
Two-sample Kolmogorov–Smirnov test
data: data1 and data2
D = 0.99, p-value = 1.299e-14
alternative hypothesis: two-sided
Dari hasilnya, kita dapat melihat bahwa statistik pengujian adalah 0,99 dan nilai p yang sesuai adalah 1,299e-14 . Karena nilai p kurang dari 0,05, kami menolak hipotesis nol. Kami memiliki cukup bukti untuk mengatakan bahwa kedua kumpulan data sampel tersebut tidak berasal dari distribusi yang sama.
Hasil ini juga tidak mengherankan karena kami menghasilkan nilai untuk sampel pertama menggunakan distribusi Poisson dan nilai untuk sampel kedua menggunakan distribusi normal .
Sumber daya tambahan
Cara melakukan tes Shapiro-Wilk di R
Cara melakukan tes Anderson-Darling di R
Cara melakukan uji normalitas multivariat di R