Hoe u een mann-whitney u-test uitvoert in python
Een Mann-Whitney U-test wordt gebruikt om verschillen tussen twee steekproeven te vergelijken wanneer de steekproefverdeling niet normaal verdeeld is en de steekproefomvang klein is (n <30).
Het wordt beschouwd als het niet-parametrische equivalent van de t-test met twee steekproeven .
In deze tutorial wordt uitgelegd hoe u een Mann-Whitney U-test in Python uitvoert.
Voorbeeld: Mann-Whitney U-test in Python
Onderzoekers willen weten of brandstofbehandeling een verandering in het gemiddelde mpg van een auto veroorzaakt. Om dit te testen meten ze het mpg van 12 auto’s met brandstofbehandeling en 12 auto’s zonder behandeling.
Omdat de steekproefomvang klein is en de onderzoekers vermoeden dat de steekproefverdeling niet normaal verdeeld is, besloten ze een Mann-Whitney U-test uit te voeren om te bepalen of er een statistisch significant verschil in mpg tussen de twee groepen bestaat.
Voer de volgende stappen uit om een Mann-Whitney U-test in Python uit te voeren.
Stap 1: Creëer de gegevens.
Eerst maken we twee tabellen met de mpg-waarden voor elke autogroep:
group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19] group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]
Stap 2: Voer een Mann-Whitney U-test uit.
Vervolgens zullen we de functie mannwhitneyu() uit de bibliotheek scipy.stats gebruiken om een Mann-Whitney U-test uit te voeren, die de volgende syntaxis gebruikt:
mannwhitneyu(x, y, use_continuity=Waar, alternatief=Geen)
Goud:
- x: een tabel met voorbeeldobservaties uit groep 1
- y: een tabel met voorbeeldobservaties uit groep 2
- use_continuity: als er rekening moet worden gehouden met een continuïteitscorrectie (1/2). De standaardwaarde is Waar.
- alternatief: definieert de alternatieve hypothese. De standaardwaarde is ‚Geen‘, waarmee een p-waarde wordt berekend die de helft is van de ‚tweezijdige‘ p-waarde. Andere opties zijn ‘tweezijdig’, ‘minder’ en ‘plus’.
U kunt deze functie als volgt gebruiken in ons specifieke voorbeeld:
import scipy.stats as stats #perform the Mann-Whitney U test stats. mannwhitneyu (group1, group2, alternative=' two-sided ') (statistic=50.0, pvalue=0.2114)
De teststatistiek is 50,0 en de overeenkomstige tweezijdige p-waarde is 0,2114 .
Stap 3: Interpreteer de resultaten.
In dit voorbeeld gebruikt de Mann-Whitney U-test de volgende nul- en alternatieve hypothesen:
H 0 : MPG is gelijk tussen de twee groepen
H A : MPG is niet gelijk tussen de twee groepen
Omdat de p-waarde ( 0,2114 ) niet minder dan 0,05 bedraagt, slagen we er niet in de nulhypothese te verwerpen.
Dit betekent dat we niet genoeg bewijs hebben om te zeggen dat de werkelijke gemiddelde mpg tussen de twee groepen verschillend is.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u een Mann-Whitney U-test uitvoert in verschillende statistische software:
Hoe u een Mann-Whitney U-test uitvoert in Excel
Hoe voer je een Mann-Whitney U-test uit in R
Hoe u een Mann-Whitney U-test uitvoert in SPSS