Dixon'ın q testi: tanım + örnek
Genellikle basitçe Q Testi olarak adlandırılan Dixon’ın Q Testi , bir veri kümesindeki aykırı değerleri tespit etmek için kullanılan istatistiksel bir testtir.
Q testi istatistiği:
Q = |x a – xb | /R
burada x a şüpheli aykırı değerdir, x b x a’ya en yakın veri noktasıdır ve R veri kümesinin aralığıdır. Çoğu durumda xa , veri kümesinin maksimum değeridir ancak minimum değer de olabilir.
Q testinin genellikle küçük veri kümeleri üzerinde yapıldığını ve verilerin normal dağıldığını varsaydığını belirtmek önemlidir. Belirli bir veri seti için Q testinin yalnızca bir kez yapılması gerektiğine dikkat etmek de önemlidir.
Dixon Q Testi Elle Nasıl Yapılır?
Aşağıdaki veri setine sahip olduğumuzu varsayalım:
1, 3, 5, 7, 8, 9, 13, 25
Bu veri setindeki maksimum değerin aykırı değer olup olmadığını belirlemek amacıyla Dixon’ın Q testini manuel olarak gerçekleştirmek için standart beş adımlı hipotez testi prosedürünü takip edebiliriz:
Adım 1. Hipotezleri belirtin.
Sıfır hipotezi (H0): Maksimum bir aykırı değer değildir.
Alternatif hipotez: (Ha): Maksimum bir aykırı değerdir .
Adım 2. Kullanılacak bir önem düzeyi belirleyin.
Ortak seçenekler 0,1, 0,05 ve 0,01’dir. Bu örnek için 0,05 anlamlılık düzeyini kullanacağız.
Adım 3. Test istatistiğini bulun.
Q = |x a – xb | /R
Bu durumda maksimum değerimiz x a = 25, bir sonraki en yakın değerimiz x b = 13, aralığımız ise R = 25 – 1 = 24 olur.
Böylece Q = |25 – 13| / 24 = 0,5 .
Daha sonra bu test istatistiğini, farklı örneklem boyutları (n) ve güven düzeyleri için aşağıda gösterilen kritik Q testi değerleriyle karşılaştırabiliriz:
%90 %95 %99
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568
11 0,392 0,444 0,542
12 0,376 0,426 0,522
13 0,361 0,410 0,503
14 0,349 0,396 0,488
15 0,338 0,384 0,475
16 0,329 0,374 0,463
17 0,320 0,365 0,452
18 0,313 0,356 0,442
19 0,306 0,349 0,433
20 0,300 0,342 0,425
21 0,295 0,337 0,418
22 0,290 0,331 0,411
23 0,285 0,326 0,404
24 0,281 0,321 0,399
25 0,277 0,317 0,393
26 0,273 0,312 0,388
27 0,269 0,308 0,384
28 0,266 0,305 0,380
29 0,263 0,301 0,376
30 0,260 0,290 0,372
8’lik bir örneklem ve %95’lik bir güven düzeyi için kritik değer 0,526’dır .
Adım 4. Boş hipotezi reddedin veya reddetmeyin.
Test istatistiğimiz Q (0,5) kritik değerden (0,526) küçük olduğundan sıfır hipotezini reddedemiyoruz.
Adım 5. Sonuçları yorumlayın.
Sıfır hipotezini reddetmeyi başaramadığımız için maksimum 25 değerinin bu veri setinde aykırı değer olmadığı sonucuna vardık.
R’de Dixon’ın Q testi nasıl yapılır?
Dixon’ın Q Testini R’deki aynı veri kümesi üzerinde gerçekleştirmek için, aşağıdaki sözdizimini kullanan outliers kütüphanesindeki dixon.test() fonksiyonunu kullanabiliriz:
dixon.test(veri, , tür = 10, karşıt = YANLIŞ)
- veri: veri değerlerinin sayısal bir vektörü
- tür: Q istatistiksel testini gerçekleştirmek için kullanılacak formülün türü. Daha önce açıklanan formülü kullanmak için 10’a ayarlayın.
- tersi: YANLIŞ ise test, maksimum değerin aykırı değer olup olmadığını belirler. DOĞRU ise test, minimum değerin aykırı değer olup olmadığını belirler. Bu, varsayılan olarak YANLIŞ’tır.
Not : dixon.test() ile ilgili tüm belgeleri burada bulabilirsiniz.
Aşağıdaki kod, veri kümesindeki maksimum değerin aykırı değer olup olmadığını belirlemek için Dixon Q testinin nasıl gerçekleştirileceğini gösterir.
#load the outliers library library(outliers) #create data data <- c(1, 3, 5, 7, 8, 9, 13, 25) #conduct Dixon's Q Test dixon.test(data, type = 10) # Dixon test for outliers # #data:data #Q = 0.5, p-value = 0.06913 #alternative hypothesis: highest value 25 is an outlier
Sonuçtan test istatistiğinin Q = 0,5 ve karşılık gelen p değerinin 0,06913 olduğunu görebiliriz. Bu nedenle, sıfır hipotezini 0,05 anlamlılık düzeyinde reddetmekte başarısız oluyoruz ve 25’in aykırı değer olmadığı sonucuna varıyoruz. Bu, manuel olarak elde ettiğimiz sonuca karşılık gelir.