Dunn's test voor meerdere vergelijkingen
Een Kruskal-Wallis-test wordt gebruikt om te bepalen of er al dan niet een statistisch significant verschil bestaat tussen de medianen van drie of meer onafhankelijke groepen. Het wordt beschouwd als het niet-parametrische equivalent van eenrichtings-ANOVA .
Als de resultaten van een Kruskal-Wallis-test statistisch significant zijn, is het passend om de Dunn-test uit te voeren om precies te bepalen welke groepen verschillend zijn.
De test van Dunn voert paarsgewijze vergelijkingen uit tussen elke onafhankelijke groep en vertelt u welke groepen statistisch significant verschillend zijn op een bepaald niveau van α.
Stel bijvoorbeeld dat een onderzoeker wil weten of drie verschillende medicijnen verschillende effecten hebben op rugpijn. Hij rekruteert 30 proefpersonen voor het onderzoek en wijst ze een maand lang willekeurig toe aan medicijn A, medicijn B of medicijn C, en meet vervolgens aan het einde van de maand hun rugpijn.
De onderzoeker kan een Kruskal-Wallis-test uitvoeren om te bepalen of de gemiddelde rugpijn gelijk is tussen de drie medicijnen. Als de p-waarde van de Kruskal-Wallis-test onder een bepaalde drempel ligt, kan worden gezegd dat de drie medicijnen verschillende effecten hebben.
De onderzoeker zou dan de Dunn-test kunnen uitvoeren om te bepalen welke medicijnen statistisch significante effecten veroorzaken.
Dunn’s test: de formule
U zult de Dunn-test waarschijnlijk nooit met de hand hoeven uit te voeren, omdat dit kan worden gedaan met behulp van statistische software (zoals R, Python, Stata, SPSS, enz.), maar de formule voor het berekenen van de z-teststatistiek voor het verschil tussen twee groepen is als volgt:
z ik = y ik / σ ik
waarbij i een van de vergelijkingen van 1 tot m is, y i = WA – WB (waarbij WA het gemiddelde is van de som van de rangen voor de i- de groep) en σ i als volgt wordt berekend:
σ ik = √ ((N(N+1)/12) – (ΣT 3 s – T s /(12(N-1)) / ((1/n A )+(1/n B ))
waarbij N het totale aantal waarnemingen in alle groepen is, r het aantal gekoppelde rangen is en Ts het aantal waarnemingen is dat is gekoppeld aan de specifieke gekoppelde waarde.
Hoe u het foutenpercentage per gezin kunt beheersen
Wanneer we meerdere vergelijkingen tegelijk uitvoeren, is het belangrijk om het foutenpercentage per gezin te beheersen. Eén manier om dit te doen is door de p-waarden aan te passen die het resultaat zijn van meerdere vergelijkingen.
Er zijn verschillende manieren om p-waarden aan te passen, maar de twee meest voorkomende aanpassingsmethoden zijn:
1. De Bonferroni-aanpassing
Aangepaste p-waarde = p*m
Goud:
- p: De oorspronkelijke p-waarde
- m: het totale aantal gemaakte vergelijkingen
2. De Sidak-aanpassing
Aangepaste p-waarde = 1 – (1-p) m
Goud:
- p: De oorspronkelijke p-waarde
- m: het totale aantal gemaakte vergelijkingen
Door een van deze p-waardeaanpassingen te gebruiken, kunnen we de kans op het maken van een Type I-fout in de reeks van meerdere vergelijkingen aanzienlijk verkleinen.
Aanvullende bronnen
Hoe de Dunn-test uit te voeren in R
Hoe de Dunn-test in Python uit te voeren