Hoe voer je een kruskal-wallis-test uit in r


Een Kruskal-Wallis-test wordt gebruikt om te bepalen of er al dan niet een statistisch significant verschil bestaat tussen de medianen van drie of meer onafhankelijke groepen.

Het wordt beschouwd als het niet-parametrische equivalent van eenrichtings-ANOVA .

In deze tutorial wordt uitgelegd hoe u een Kruskal-Wallis-test uitvoert in R.

Voorbeeld: Kruskal-Wallis-test in R

Stel dat onderzoekers willen weten of drie verschillende meststoffen tot verschillende niveaus van plantengroei leiden. Ze selecteren willekeurig 30 verschillende planten en verdelen ze in drie groepen van 10, waarbij elke groep een andere meststof wordt toegediend. Na een maand meten ze de hoogte van elke plant.

Volg de volgende stappen om een Kruskal-Wallis-test uit te voeren om te bepalen of de mediane groei voor alle drie de groepen hetzelfde is.

Stap 1: Voer de gegevens in.

Eerst zullen we het volgende gegevensframe maken dat de groei van de 30 planten en hun meststofgroep bevat:

 #create data frame
df <- data. frame (group=rep(c(' A ', ' B ', ' C '), each= 10 ),
                 height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
                          15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
                          6, 8, 8, 9, 5, 14, 13, 8, 10, 9))

#view first six rows of data frame
head(df)

  group height
1 to 7
2 to 14
3 to 14
4 to 13
5 to 12
6 to 9

Stap 2: Voer de Kruskal-Wallis-test uit.

Vervolgens zullen we een Kruskal-Wallis-test uitvoeren met behulp van de ingebouwde functie kruskal.test() van de R-database:

 #perform Kruskal-Wallis Test 
kruskal. test (height ~ group, data = df) 

	Kruskal-Wallis rank sum test

data: height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311

Stap 3: Interpreteer de resultaten.

De Kruskal-Wallis-test gebruikt de volgende nul- en alternatieve hypothesen:

De nulhypothese (H 0 ): De mediaan is in alle groepen gelijk.

De alternatieve hypothese: ( HA ): De mediaan is niet in alle groepen gelijk.

In dit geval is de teststatistiek 6,2878 en de overeenkomstige p-waarde 0,0431 .

Omdat deze p-waarde kleiner is dan 0,05, kunnen we de nulhypothese verwerpen dat de gemiddelde plantengroei voor alle drie de meststoffen hetzelfde is.

Dit betekent dat we voldoende bewijs hebben om te concluderen dat het gebruikte type meststof statistisch significante verschillen in plantengroei veroorzaakt.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere algemene statistische tests in R kunt uitvoeren:

Hoe voer je een paired samples t-test uit in R
Eenrichtings-ANOVA uitvoeren in R
Hoe herhaalde metingen ANOVA in R uit te voeren

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert