Jak wykonać test kruskala-wallisa w r


Test Kruskala-Wallisa służy do określenia, czy istnieje statystycznie istotna różnica między medianami trzech lub więcej niezależnych grup.

Uważa się, że jest to nieparametryczny odpowiednik jednokierunkowej analizy wariancji ANOVA .

W tym samouczku wyjaśniono, jak wykonać test Kruskala-Wallisa w języku R.

Przykład: test Kruskala-Wallisa w R

Załóżmy, że badacze chcą wiedzieć, czy trzy różne nawozy prowadzą do różnych poziomów wzrostu roślin. Losowo wybierają 30 różnych roślin i dzielą je na trzy grupy po 10, stosując do każdej grupy inny nawóz. Po miesiącu mierzą wysokość każdej rośliny.

Wykonaj poniższe kroki, aby wykonać test Kruskala-Wallisa w celu ustalenia, czy mediana wzrostu jest taka sama we wszystkich trzech grupach.

Krok 1: Wprowadź dane.

Najpierw utworzymy następującą ramkę danych zawierającą wzrost 30 roślin oraz ich grupę nawozów:

 #create data frame
df <- data. frame (group=rep(c(' A ', ' B ', ' C '), each= 10 ),
                 height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
                          15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
                          6, 8, 8, 9, 5, 14, 13, 8, 10, 9))

#view first six rows of data frame
head(df)

  group height
1 to 7
2 to 14
3 to 14
4 to 13
5 to 12
6 to 9

Krok 2: Wykonaj test Kruskala-Wallisa.

Następnie wykonamy test Kruskala-Wallisa wykorzystując wbudowaną funkcję kruskal.test() bazy danych R:

 #perform Kruskal-Wallis Test 
kruskal. test (height ~ group, data = df) 

	Kruskal-Wallis rank sum test

data: height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311

Krok 3: Interpretacja wyników.

Test Kruskala-Wallisa wykorzystuje następujące hipotezy zerowe i alternatywne:

Hipoteza zerowa (H 0 ): Mediana jest równa we wszystkich grupach.

Hipoteza alternatywna: ( HA ): Mediana nie jest równa we wszystkich grupach.

W tym przypadku statystyka testowa wynosi 6,2878 , a odpowiadająca jej wartość p wynosi 0,0431 .

Ponieważ ta wartość p jest mniejsza niż 0,05, możemy odrzucić hipotezę zerową, że średni wzrost roślin jest taki sam dla wszystkich trzech nawozów.

Oznacza to, że mamy wystarczające dowody, aby stwierdzić, że rodzaj użytego nawozu powoduje statystycznie istotne różnice we wzroście roślin.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne popularne testy statystyczne w R:

Jak wykonać test t dla sparowanych próbek w R
Jak wykonać jednokierunkową ANOVA w R
Jak wykonać powtarzane pomiary ANOVA w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *