Dixons q-test: definition + beispiel


Der Q-Test von Dixon , oft einfach Q-Test genannt, ist ein statistischer Test zur Erkennung von Ausreißern in einem Datensatz.

Die Q-Teststatistik lautet:

Q = |x axb | /R

Dabei ist x a der vermutete Ausreißer, x b der Datenpunkt, der x a am nächsten liegt, und R der Bereich des Datensatzes. In den meisten Fällen ist x a der Maximalwert des Datensatzes, es kann aber auch der Minimalwert sein.

Es ist wichtig zu beachten, dass der Q-Test normalerweise an kleinen Datensätzen durchgeführt wird und davon ausgeht, dass die Daten normalverteilt sind. Es ist außerdem wichtig zu beachten, dass der Q-Test für einen bestimmten Datensatz nur einmal durchgeführt werden sollte.

So führen Sie den Dixon-Q-Test manuell durch

Angenommen, wir haben den folgenden Datensatz:

1, 3, 5, 7, 8, 9, 13, 25

Wir können dem standardmäßigen fünfstufigen Hypothesentestverfahren folgen, um manuell den Q-Test von Dixon durchzuführen, um zu bestimmen, ob der Maximalwert in diesem Datensatz ein Ausreißer ist:

Schritt 1. Formulieren Sie die Hypothesen.

Die Nullhypothese (H0): Das Maximum ist kein Ausreißer.

Die Alternativhypothese: (Ha): Das Maximum ist ein Ausreißer.

Schritt 2: Bestimmen Sie ein zu verwendendes Signifikanzniveau.

Übliche Optionen sind 0,1, 0,05 und 0,01. Für dieses Beispiel verwenden wir ein Signifikanzniveau von 0,05.

Schritt 3. Finden Sie die Teststatistik.

Q = |x axb | /R

In diesem Fall ist unser Maximalwert x a = 25, unser nächstnächster Wert ist x b = 13 und unser Bereich ist R = 25 – 1 = 24.

Somit ist Q = |25 – 13| / 24 = 0,5 .

Dann können wir diese Teststatistik mit den kritischen Q-Testwerten vergleichen, die unten für verschiedene Stichprobengrößen (n) und Konfidenzniveaus gezeigt werden:

n 90 % 95 % 99 %
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568
11 0,392 0,444 0,542
12 0,376 0,426 0,522
13 0,361 0,410 0,503
14 0,349 0,396 0,488
15 0,338 0,384 0,475
16 0,329 0,374 0,463
17 0,320 0,365 0,452
18 0,313 0,356 0,442
19 0,306 0,349 0,433
20 0,300 0,342 0,425
21 0,295 0,337 0,418
22 0,290 0,331 0,411
23 0,285 0,326 0,404
24 0,281 0,321 0,399
25 0,277 0,317 0,393
26 0,273 0,312 0,388
27 0,269 0,308 0,384
28 0,266 0,305 0,380
29 0,263 0,301 0,376
30 0,260 0,290 0,372

Der kritische Wert für eine Stichprobe von 8 und ein Konfidenzniveau von 95 % beträgt 0,526 .

Schritt 4. Lehnen Sie die Nullhypothese ab oder lehnen Sie sie nicht ab.

Da unsere Teststatistik Q (0,5) kleiner als der kritische Wert (0,526) ist, können wir die Nullhypothese nicht ablehnen.

Schritt 5. Interpretieren Sie die Ergebnisse.

Da es uns nicht gelungen ist, die Nullhypothese abzulehnen, kommen wir zu dem Schluss, dass der Maximalwert von 25 in diesem Datensatz kein Ausreißer ist.

So führen Sie den Dixon-Q-Test in R durch

Um den Q-Test von Dixon für denselben Datensatz in R durchzuführen, können wir die Funktion dixon.test() aus der Outliers- Bibliothek verwenden, die die folgende Syntax verwendet:

dixon.test(Daten, Typ = 10, Gegenteil = FALSCH)

  • Daten: ein numerischer Vektor von Datenwerten
  • Typ: Der Formeltyp, der zur Durchführung des statistischen Q-Tests verwendet werden soll. Stellen Sie den Wert auf 10 ein, um die zuvor beschriebene Formel zu verwenden.
  • Gegenteil: Bei FALSE ermittelt der Test, ob der Maximalwert ein Ausreißer ist. Bei TRUE bestimmt der Test, ob der Mindestwert ein Ausreißer ist. Dies ist standardmäßig FALSE.

Hinweis : Die vollständige Dokumentation für dixon.test() finden Sie hier .

Der folgende Code zeigt, wie der Dixon-Q-Test durchgeführt wird, um zu bestimmen, ob der Maximalwert im Datensatz ein Ausreißer ist.

 #load the outliers library
library(outliers)

#create data
data <- c(1, 3, 5, 7, 8, 9, 13, 25)

#conduct Dixon's Q Test
dixon.test(data, type = 10)

# Dixon test for outliers
#
#data:data
#Q = 0.5, p-value = 0.06913
#alternative hypothesis: highest value 25 is an outlier

Aus dem Ergebnis können wir ersehen, dass die Teststatistik Q = 0,5 ist und der entsprechende p-Wert 0,06913 beträgt. Daher können wir die Nullhypothese beim Signifikanzniveau 0,05 nicht ablehnen und kommen zu dem Schluss, dass 25 kein Ausreißer ist. Dies entspricht dem Ergebnis, das wir manuell erhalten haben.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert