Comment effectuer un test de Kruskal-Wallis dans R



Un test de Kruskal-Wallis est utilisé pour déterminer s’il existe ou non une différence statistiquement significative entre les médianes de trois groupes indépendants ou plus.

Elle est considérée comme l’équivalent non paramétrique de l’ ANOVA unidirectionnelle .

Ce tutoriel explique comment effectuer un test de Kruskal-Wallis dans R.

Exemple : test de Kruskal-Wallis dans R

Supposons que les chercheurs souhaitent savoir si trois engrais différents conduisent à différents niveaux de croissance des plantes. Ils sélectionnent au hasard 30 plantes différentes et les divisent en trois groupes de 10, en appliquant un engrais différent à chaque groupe. Au bout d’un mois, ils mesurent la hauteur de chaque plante.

Suivez les étapes suivantes pour effectuer un test de Kruskal-Wallis afin de déterminer si la croissance médiane est la même dans les trois groupes.

Étape 1 : Saisissez les données.

Tout d’abord, nous allons créer le bloc de données suivant qui contient la croissance des 30 plantes ainsi que leur groupe d’engrais :

#create data frame
df <- data.frame(group=rep(c('A', 'B', 'C'), each=10),
                 height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
                          15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
                          6, 8, 8, 9, 5, 14, 13, 8, 10, 9))

#view first six rows of data frame
head(df)

  group height
1     A      7
2     A     14
3     A     14
4     A     13
5     A     12
6     A      9

Étape 2 : Effectuez le test de Kruskal-Wallis.

Ensuite, nous effectuerons un test de Kruskal-Wallis en utilisant la fonction kruskal.test() intégrée de la base R :

#perform Kruskal-Wallis Test 
kruskal.test(height ~ group, data = df) 

	Kruskal-Wallis rank sum test

data:  height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311

Étape 3 : Interprétez les résultats.

Le test de Kruskal-Wallis utilise les hypothèses nulles et alternatives suivantes :

L’hypothèse nulle (H 0 ) : La médiane est égale dans tous les groupes.

L’hypothèse alternative : (H A ) : La médiane n’est pas égale dans tous les groupes.

Dans ce cas, la statistique de test est de 6,2878 et la valeur p correspondante est de 0,0431 .

Puisque cette valeur p est inférieure à 0,05, nous pouvons rejeter l’hypothèse nulle selon laquelle la croissance médiane des plantes est la même pour les trois engrais.

Cela signifie que nous disposons de suffisamment de preuves pour conclure que le type d’engrais utilisé entraîne des différences statistiquement significatives dans la croissance des plantes.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tests statistiques courants dans R :

Comment effectuer un test t pour échantillons appariés dans R
Comment effectuer une ANOVA unidirectionnelle dans R
Comment effectuer une ANOVA à mesures répétées dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *