Jak wykonać test kruskala-wallisa w pythonie
Test Kruskala-Wallisa służy do określenia, czy istnieje statystycznie istotna różnica między medianami trzech lub więcej niezależnych grup.
Uważa się, że jest to nieparametryczny odpowiednik jednokierunkowej analizy wariancji ANOVA .
W tym samouczku wyjaśniono, jak wykonać test Kruskala-Wallisa w języku Python.
Przykład: test Kruskala-Wallisa w Pythonie
Naukowcy chcą wiedzieć, czy trzy różne nawozy prowadzą do różnych poziomów wzrostu roślin. Losowo wybierają 30 różnych roślin i dzielą je na trzy grupy po 10, stosując do każdej grupy inny nawóz. Po miesiącu mierzą wysokość każdej rośliny.
Wykonaj poniższe kroki, aby wykonać test Kruskala-Wallisa w celu ustalenia, czy mediana wzrostu jest taka sama we wszystkich trzech grupach.
Krok 1: Wprowadź dane.
Najpierw utworzymy trzy tabele do przechowywania pomiarów roślin dla każdej z trzech grup:
group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8] group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8] group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]
Krok 2: Wykonaj test Kruskala-Wallisa.
Następnie wykonamy test Kruskala-Wallisa wykorzystując funkcję kruskal() z biblioteki scipy.stats:
from scipy import stats #perform Kruskal-Wallis Test stats.kruskal(group1, group2, group3) (statistic=6.2878, pvalue=0.0431)
Krok 3: Interpretacja wyników.
Test Kruskala-Wallisa wykorzystuje następujące hipotezy zerowe i alternatywne:
Hipoteza zerowa (H 0 ): Mediana jest równa we wszystkich grupach.
Hipoteza alternatywna: (Ha): Mediana nie jest równa we wszystkich grupach.
W tym przypadku statystyka testowa wynosi 6,2878 , a odpowiadająca jej wartość p wynosi 0,0431 . Ponieważ ta wartość p jest mniejsza niż 0,05, możemy odrzucić hipotezę zerową, że średni wzrost roślin jest taki sam dla wszystkich trzech nawozów. Mamy wystarczające dowody, aby stwierdzić, że rodzaj zastosowanego nawozu powoduje statystycznie istotne różnice we wzroście roślin.