Tes q dixon: definisi + contoh
Uji Q Dixon , sering disebut Uji Q , adalah uji statistik yang digunakan untuk mendeteksi outlier dalam kumpulan data.
Statistik uji Q adalah:
Q = | xa – xb | /R
di mana xa adalah dugaan outlier, x b adalah titik data terdekat dengan xa , dan R adalah rentang kumpulan data. Dalam kebanyakan kasus, x a adalah nilai maksimum kumpulan data, namun bisa juga merupakan nilai minimum.
Penting untuk dicatat bahwa uji Q biasanya dilakukan pada kumpulan data kecil dan mengasumsikan bahwa data terdistribusi normal. Penting juga untuk dicatat bahwa uji Q hanya boleh dilakukan satu kali untuk kumpulan data tertentu.
Cara Melakukan Tes Dixon Q dengan Tangan
Misalkan kita memiliki kumpulan data berikut:
1, 3, 5, 7, 8, 9, 13, 25
Kita dapat mengikuti prosedur pengujian hipotesis lima langkah standar untuk melakukan uji Dixon Q secara manual untuk menentukan apakah nilai maksimum dalam kumpulan data ini merupakan outlier:
Langkah 1. Nyatakan hipotesisnya.
Hipotesis nol (H0): Nilai maksimum bukanlah outlier.
Hipotesis alternatif: (Ha): Maks adalah outlier.
Langkah 2. Tentukan tingkat signifikansi yang akan digunakan.
Pilihan umum adalah 0,1, 0,05, dan 0,01. Kita akan menggunakan tingkat signifikansi 0,05 untuk contoh ini.
Langkah 3. Temukan statistik pengujian.
Q = | xa – xb | /R
Dalam hal ini, nilai maksimum kita adalah x a = 25, nilai terdekat berikutnya adalah x b = 13, dan rentang kita adalah R = 25 – 1 = 24.
Jadi Q = |25 – 13| / 24 = 0,5 .
Kemudian kita dapat membandingkan statistik pengujian ini dengan nilai pengujian Q kritis, yang ditunjukkan di bawah ini untuk ukuran sampel (n) dan tingkat kepercayaan yang berbeda:
 n 90% 95% 99%
 3 0,941 0,970 0,994
 4 0,765 0,829 0,926
 5 0,642 0,710 0,821
 6 0,560 0,625 0,740
 7 0,507 0,568 0,680
 8 0,468 0,526 0,634
 9 0,437 0,493 0,598
 10 0,412 0,466 0,568
 11 0,392 0,444 0,542
 12 0,376 0,426 0,522
 13 0,361 0,410 0,503
 14 0,349 0,396 0,488
 15 0,338 0,384 0,475
 16 0,329 0,374 0,463
 17 0,320 0,365 0,452
 18 0,313 0,356 0,442
 19 0,306 0,349 0,433
 20 0,300 0,342 0,425
 21 0,295 0,337 0,418
 22 0,290 0,331 0,411
 23 0,285 0,326 0,404
 24 0,281 0,321 0,399
 25 0,277 0,317 0,393
 26 0,273 0,312 0,388
 27 0,269 0,308 0,384
 28 0,266 0,305 0,380
 29 0,263 0,301 0,376
 30 0,260 0,290 0,372
Nilai kritis sampel 8 dan tingkat kepercayaan 95% adalah 0,526 .
Langkah 4. Tolak atau jangan tolak hipotesis nol.
Karena statistik pengujian kami Q (0,5) lebih kecil dari nilai kritis (0,526), kami gagal menolak hipotesis nol.
Langkah 5. Interpretasikan hasilnya.
Karena kami gagal menolak hipotesis nol, kami menyimpulkan bahwa nilai maksimum 25 bukanlah outlier dalam kumpulan data ini.
Bagaimana melakukan tes Q Dixon di R
Untuk melakukan Uji Q Dixon pada kumpulan data yang sama di R, kita dapat menggunakan fungsi dixon.test() dari pustaka outlier , yang menggunakan sintaksis berikut:
dixon.test(data, , ketik = 10, kebalikannya = SALAH)
- data: vektor numerik dari nilai data
- type: Jenis rumus yang digunakan untuk melakukan uji statistik Q. Setel ke 10 untuk menggunakan rumus yang dijelaskan sebelumnya.
- sebaliknya: Jika FALSE, pengujian menentukan apakah nilai maksimum merupakan outlier. Jika BENAR, pengujian akan menentukan apakah nilai minimum merupakan outlier. Ini SALAH secara default.
Catatan : Temukan dokumentasi lengkap untuk dixon.test() di sini .
Kode berikut menunjukkan cara melakukan uji Dixon’s Q untuk menentukan apakah nilai maksimum dalam kumpulan data merupakan outlier.
#load the outliers library library(outliers) #create data data <- c(1, 3, 5, 7, 8, 9, 13, 25) #conduct Dixon's Q Test dixon.test(data, type = 10) # Dixon test for outliers # #data:data #Q = 0.5, p-value = 0.06913 #alternative hypothesis: highest value 25 is an outlier
Dari hasilnya, kita dapat melihat bahwa statistik uji adalah Q = 0,5 dan nilai p yang sesuai adalah 0,06913 . Oleh karena itu, kami gagal menolak hipotesis nol pada tingkat signifikansi 0,05 dan menyimpulkan bahwa 25 bukanlah suatu outlier. Ini sesuai dengan hasil yang kami peroleh secara manual.
