Come eseguire un test di kruskal-wallis in r


Un test di Kruskal-Wallis viene utilizzato per determinare se esiste o meno una differenza statisticamente significativa tra le mediane di tre o più gruppi indipendenti.

È considerato l’equivalente non parametrico dell’ANOVA unidirezionale .

Questo tutorial spiega come eseguire un test Kruskal-Wallis in R.

Esempio: test di Kruskal-Wallis in R

Supponiamo che i ricercatori vogliano sapere se tre diversi fertilizzanti portano a diversi livelli di crescita delle piante. Selezionano casualmente 30 piante diverse e le dividono in tre gruppi da 10, applicando un fertilizzante diverso a ciascun gruppo. Dopo un mese si misura l’altezza di ogni pianta.

Seguire i passaggi seguenti per eseguire un test Kruskal-Wallis per determinare se la crescita mediana è la stessa in tutti e tre i gruppi.

Passaggio 1: inserisci i dati.

Per prima cosa creeremo il seguente frame di dati che contiene la crescita delle 30 piante e il loro gruppo di fertilizzanti:

 #create data frame
df <- data. frame (group=rep(c(' A ', ' B ', ' C '), each= 10 ),
                 height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
                          15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
                          6, 8, 8, 9, 5, 14, 13, 8, 10, 9))

#view first six rows of data frame
head(df)

  group height
1 to 7
2 to 14
3 to 14
4 to 13
5 to 12
6 to 9

Passaggio 2: eseguire il test Kruskal-Wallis.

Successivamente, eseguiremo un test Kruskal-Wallis utilizzando la funzione integrata kruskal.test() del database R:

 #perform Kruskal-Wallis Test 
kruskal. test (height ~ group, data = df) 

	Kruskal-Wallis rank sum test

data: height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311

Passaggio 3: interpretare i risultati.

Il test di Kruskal-Wallis utilizza le seguenti ipotesi nulle e alternative:

L’ipotesi nulla (H 0 ): la mediana è uguale in tutti i gruppi.

L’ipotesi alternativa: ( HA ): la mediana non è uguale in tutti i gruppi.

In questo caso, la statistica del test è 6,2878 e il corrispondente valore p è 0,0431 .

Poiché questo valore p è inferiore a 0,05, possiamo rifiutare l’ipotesi nulla secondo cui la crescita media delle piante è la stessa per tutti e tre i fertilizzanti.

Ciò significa che abbiamo prove sufficienti per concludere che il tipo di fertilizzante utilizzato provoca differenze statisticamente significative nella crescita delle piante.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altri test statistici comuni in R:

Come eseguire un t-test per campioni accoppiati in R
Come eseguire l’ANOVA unidirezionale in R
Come eseguire l’ANOVA a misure ripetute in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *