Test q di dixon: definizione + esempio
Il Q Test di Dixon , spesso chiamato semplicemente Q Test , è un test statistico utilizzato per rilevare valori anomali in un set di dati.
La statistica del test Q è:
Q = |x a – xb | /R
dove x a è il sospetto valore anomalo, x b è il punto dati più vicino a x a e R è l’intervallo del set di dati. Nella maggior parte dei casi x a è il valore massimo del set di dati, ma può anche essere il valore minimo.
È importante notare che il test Q viene solitamente eseguito su piccoli set di dati e presuppone che i dati siano distribuiti normalmente. È anche importante notare che il test Q dovrebbe essere eseguito solo una volta per un dato set di dati.
Come eseguire manualmente il test Dixon Q
Supponiamo di avere il seguente set di dati:
1, 3, 5, 7, 8, 9, 13, 25
Possiamo seguire la procedura standard di test delle ipotesi in cinque passaggi per eseguire manualmente il test Q di Dixon per determinare se il valore massimo in questo set di dati è un valore anomalo:
Passaggio 1. Enunciare le ipotesi.
L’ipotesi nulla (H0): il massimo non è un valore anomalo.
L’ipotesi alternativa: (Ha): il massimo è un valore anomalo.
Passaggio 2. Determinare un livello di significatività da utilizzare.
Le scelte comuni sono 0,1, 0,05 e 0,01. Utilizzeremo un livello di significatività pari a 0,05 per questo esempio.
Passaggio 3. Trova la statistica del test.
Q = |x a – xb | /R
In questo caso, il nostro valore massimo è x a = 25, il nostro valore successivo più vicino è x b = 13 e il nostro intervallo è R = 25 – 1 = 24.
Quindi Q = |25 – 13| /24 = 0,5 .
Quindi possiamo confrontare questa statistica del test con i valori critici del test Q, che sono mostrati di seguito per diverse dimensioni del campione (n) e livelli di confidenza:
n 90% 95% 99%
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568
11 0,392 0,444 0,542
12 0,376 0,426 0,522
13 0,361 0,410 0,503
14 0,349 0,396 0,488
15 0,338 0,384 0,475
16 0,329 0,374 0,463
17 0,320 0,365 0,452
18 0,313 0,356 0,442
19 0,306 0,349 0,433
20 0,300 0,342 0,425
21 0,295 0,337 0,418
22 0,290 0,331 0,411
23 0,285 0,326 0,404
24 0,281 0,321 0,399
25 0,277 0,317 0,393
26 0,273 0,312 0,388
27 0,269 0,308 0,384
28 0,266 0,305 0,380
29 0,263 0,301 0,376
30 0,260 0,290 0,372
Il valore critico per un campione di 8 e un livello di confidenza del 95% è 0,526 .
Passaggio 4. Rifiuta o non rifiutare l’ipotesi nulla.
Poiché la nostra statistica test Q (0,5) è inferiore al valore critico (0,526), non riusciamo a rifiutare l’ipotesi nulla.
Passaggio 5. Interpretare i risultati.
Poiché non siamo riusciti a rifiutare l’ipotesi nulla, concludiamo che il valore massimo di 25 non è un valore anomalo in questo set di dati.
Come eseguire il test Q di Dixon in R
Per eseguire il Q Test di Dixon sullo stesso set di dati in R, possiamo utilizzare la funzione dixon.test() dalla libreria outliers , che utilizza la seguente sintassi:
dixon.test(dati, , tipo = 10, opposto = FALSO)
- dati: un vettore numerico di valori di dati
- tipo: il tipo di formula da utilizzare per eseguire il test statistico Q. Impostare su 10 per utilizzare la formula descritta in precedenza.
- opposto: Se FALSO, il test determina se il valore massimo è un valore anomalo. Se VERO, il test determina se il valore minimo è un valore anomalo. Questo è FALSO per impostazione predefinita.
Nota : puoi trovare la documentazione completa per dixon.test() qui .
Il codice seguente illustra come eseguire il test Q di Dixon per determinare se il valore massimo nel set di dati è un valore anomalo.
#load the outliers library library(outliers) #create data data <- c(1, 3, 5, 7, 8, 9, 13, 25) #conduct Dixon's Q Test dixon.test(data, type = 10) # Dixon test for outliers # #data:data #Q = 0.5, p-value = 0.06913 #alternative hypothesis: highest value 25 is an outlier
Dal risultato, possiamo vedere che la statistica del test è Q = 0,5 e il corrispondente valore p è 0,06913 . Pertanto, non riusciamo a rifiutare l’ipotesi nulla al livello di significatività di 0,05 e concludiamo che 25 non è un valore anomalo. Ciò corrisponde al risultato che abbiamo ottenuto manualmente.