Tes q dixon: definisi + contoh
Uji Q Dixon , sering disebut Uji Q , adalah uji statistik yang digunakan untuk mendeteksi outlier dalam kumpulan data.
Statistik uji Q adalah:
Q = | xa – xb | /R
di mana xa adalah dugaan outlier, x b adalah titik data terdekat dengan xa , dan R adalah rentang kumpulan data. Dalam kebanyakan kasus, x a adalah nilai maksimum kumpulan data, namun bisa juga merupakan nilai minimum.
Penting untuk dicatat bahwa uji Q biasanya dilakukan pada kumpulan data kecil dan mengasumsikan bahwa data terdistribusi normal. Penting juga untuk dicatat bahwa uji Q hanya boleh dilakukan satu kali untuk kumpulan data tertentu.
Cara Melakukan Tes Dixon Q dengan Tangan
Misalkan kita memiliki kumpulan data berikut:
1, 3, 5, 7, 8, 9, 13, 25
Kita dapat mengikuti prosedur pengujian hipotesis lima langkah standar untuk melakukan uji Dixon Q secara manual untuk menentukan apakah nilai maksimum dalam kumpulan data ini merupakan outlier:
Langkah 1. Nyatakan hipotesisnya.
Hipotesis nol (H0): Nilai maksimum bukanlah outlier.
Hipotesis alternatif: (Ha): Maks adalah outlier.
Langkah 2. Tentukan tingkat signifikansi yang akan digunakan.
Pilihan umum adalah 0,1, 0,05, dan 0,01. Kita akan menggunakan tingkat signifikansi 0,05 untuk contoh ini.
Langkah 3. Temukan statistik pengujian.
Q = | xa – xb | /R
Dalam hal ini, nilai maksimum kita adalah x a = 25, nilai terdekat berikutnya adalah x b = 13, dan rentang kita adalah R = 25 – 1 = 24.
Jadi Q = |25 – 13| / 24 = 0,5 .
Kemudian kita dapat membandingkan statistik pengujian ini dengan nilai pengujian Q kritis, yang ditunjukkan di bawah ini untuk ukuran sampel (n) dan tingkat kepercayaan yang berbeda:
n 90% 95% 99%
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568
11 0,392 0,444 0,542
12 0,376 0,426 0,522
13 0,361 0,410 0,503
14 0,349 0,396 0,488
15 0,338 0,384 0,475
16 0,329 0,374 0,463
17 0,320 0,365 0,452
18 0,313 0,356 0,442
19 0,306 0,349 0,433
20 0,300 0,342 0,425
21 0,295 0,337 0,418
22 0,290 0,331 0,411
23 0,285 0,326 0,404
24 0,281 0,321 0,399
25 0,277 0,317 0,393
26 0,273 0,312 0,388
27 0,269 0,308 0,384
28 0,266 0,305 0,380
29 0,263 0,301 0,376
30 0,260 0,290 0,372
Nilai kritis sampel 8 dan tingkat kepercayaan 95% adalah 0,526 .
Langkah 4. Tolak atau jangan tolak hipotesis nol.
Karena statistik pengujian kami Q (0,5) lebih kecil dari nilai kritis (0,526), kami gagal menolak hipotesis nol.
Langkah 5. Interpretasikan hasilnya.
Karena kami gagal menolak hipotesis nol, kami menyimpulkan bahwa nilai maksimum 25 bukanlah outlier dalam kumpulan data ini.
Bagaimana melakukan tes Q Dixon di R
Untuk melakukan Uji Q Dixon pada kumpulan data yang sama di R, kita dapat menggunakan fungsi dixon.test() dari pustaka outlier , yang menggunakan sintaksis berikut:
dixon.test(data, , ketik = 10, kebalikannya = SALAH)
- data: vektor numerik dari nilai data
- type: Jenis rumus yang digunakan untuk melakukan uji statistik Q. Setel ke 10 untuk menggunakan rumus yang dijelaskan sebelumnya.
- sebaliknya: Jika FALSE, pengujian menentukan apakah nilai maksimum merupakan outlier. Jika BENAR, pengujian akan menentukan apakah nilai minimum merupakan outlier. Ini SALAH secara default.
Catatan : Temukan dokumentasi lengkap untuk dixon.test() di sini .
Kode berikut menunjukkan cara melakukan uji Dixon’s Q untuk menentukan apakah nilai maksimum dalam kumpulan data merupakan outlier.
#load the outliers library library(outliers) #create data data <- c(1, 3, 5, 7, 8, 9, 13, 25) #conduct Dixon's Q Test dixon.test(data, type = 10) # Dixon test for outliers # #data:data #Q = 0.5, p-value = 0.06913 #alternative hypothesis: highest value 25 is an outlier
Dari hasilnya, kita dapat melihat bahwa statistik uji adalah Q = 0,5 dan nilai p yang sesuai adalah 0,06913 . Oleh karena itu, kami gagal menolak hipotesis nol pada tingkat signifikansi 0,05 dan menyimpulkan bahwa 25 bukanlah suatu outlier. Ini sesuai dengan hasil yang kami peroleh secara manual.