Test de Kruskal-Wallis : définition, formule et exemple
Un test de Kruskal-Wallis est utilisé pour déterminer s’il existe ou non une différence statistiquement significative entre les médianes de trois groupes indépendants ou plus.
Ce test est l’équivalent non paramétrique de l’ ANOVA unidirectionnelle et est généralement utilisé lorsque l’hypothèse de normalité n’est pas respectée.
Le test de Kruskal-Wallis ne suppose pas la normalité des données et est beaucoup moins sensible aux valeurs aberrantes que l’ANOVA unidirectionnelle.
Voici quelques exemples de cas dans lesquels vous pouvez effectuer un test de Kruskal-Wallis :
Exemple 1 : Comparaison des techniques d’étude
Vous divisez au hasard une classe de 90 étudiants en trois groupes de 30. Chaque groupe utilise une technique d’étude différente pendant un mois pour préparer un examen.
A la fin du mois, tous les étudiants passent le même examen. Vous voulez savoir si la technique d’étude a un impact sur les résultats aux examens.
D’après des études précédentes, vous savez que les distributions des résultats aux examens pour ces trois techniques d’étude ne sont pas normalement distribuées. Vous effectuez donc un test de Kruskal-Wallis pour déterminer s’il existe une différence statistiquement significative entre les scores médians des trois groupes.
Exemple 2 : Comparaison de l’exposition au soleil
Vous voulez savoir si la lumière du soleil a un impact ou non sur la croissance d’une plante donnée, vous plantez donc des groupes de graines dans quatre endroits différents qui subissent un ensoleillement élevé, un ensoleillement moyen, un ensoleillement faible ou aucun ensoleillement.
Après un mois, vous mesurez la hauteur de chaque groupe de plantes. On sait que la répartition des hauteurs pour cette plante particulière n’est pas normalement distribuée et est sujette à des valeurs aberrantes.
Pour déterminer si la lumière du soleil a un impact sur la croissance, vous effectuez un test de Kruskal-Wallis pour déterminer s’il existe une différence statistiquement significative entre la hauteur médiane des quatre groupes.
Hypothèses du test de Kruskal-Wallis
Avant de pouvoir effectuer un test de Kruskal-Wallis, nous devons nous assurer que les hypothèses suivantes sont respectées :
1. Variable de réponse ordinale ou continue – la variable de réponse doit être une variable ordinale ou continue. Un exemple de variable ordinale est une question de réponse à une enquête mesurée sur une échelle de Likert (par exemple, une échelle de 5 points allant de « pas du tout d’accord » à « tout à fait d’accord ») et un exemple de variable continue est le poids (par exemple, mesuré en livres).
2. Indépendance – les observations de chaque groupe doivent être indépendantes les unes des autres. Habituellement, un plan randomisé s’en occupe.
3. Les distributions ont des formes similaires – les distributions dans chaque groupe doivent avoir une forme similaire.
Si ces hypothèses sont remplies, nous pouvons alors procéder à un test de Kruskal-Wallis.
Exemple de test de Kruskal-Wallis
Un chercheur veut savoir si trois médicaments ont des effets différents sur la douleur au genou. Il recrute donc 30 personnes qui ressentent toutes une douleur au genou similaire et les divise au hasard en trois groupes pour recevoir le médicament 1, le médicament 2 ou le médicament 3.
Après un mois de prise du médicament, le chercheur demande à chaque individu d’évaluer sa douleur au genou sur une échelle de 1 à 100, 100 indiquant la douleur la plus intense.
Les notes des 30 personnes sont présentées ci-dessous :
Drogue 1 | Drogue 2 | Drogue 3 |
---|---|---|
78 | 71 | 57 |
65 | 66 | 88 |
63 | 56 | 58 |
44 | 40 | 78 |
50 | 55 | 65 |
78 | 31 | 61 |
70 | 45 | 62 |
61 | 66 | 44 |
50 | 47 | 48 |
44 | 42 | 77 |
Le chercheur souhaite savoir si les trois médicaments ont des effets différents sur la douleur au genou. Il effectue donc un test de Kruskal-Wallis en utilisant un niveau de signification de 0,05 pour déterminer s’il existe une différence statistiquement significative entre les évaluations médianes de la douleur au genou entre ces trois médicaments. groupes.
Nous pouvons utiliser les étapes suivantes pour effectuer le test de Kruskal-Wallis :
Étape 1. Énoncez les hypothèses.
L’hypothèse nulle (H 0 ) : les évaluations médianes de la douleur au genou dans les trois groupes sont égales.
L’hypothèse alternative : (Ha) : Au moins une des évaluations médianes de la douleur au genou est différente des autres.
Étape 2. Effectuez le test de Kruskal-Wallis.
Pour effectuer un test de Kruskal-Wallis, nous pouvons simplement saisir les valeurs indiquées ci-dessus dans le calculateur de test de Kruskal-Wallis :
Cliquez ensuite sur le bouton « Calculer » :
Étape 3. Interprétez les résultats.
Puisque la valeur p du test ( 0,21342 ) n’est pas inférieure à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle.
Nous ne disposons pas de preuves suffisantes pour affirmer qu’il existe une différence statistiquement significative entre les évaluations médianes de la douleur au genou entre ces trois groupes.
Ressources additionnelles
Les tutoriels suivants expliquent comment effectuer un test de Kruskal-Wallis à l’aide de différents logiciels statistiques :
Comment effectuer un test de Kruskal-Wallis dans Excel
Comment effectuer un test Kruskal-Wallis en Python
Comment effectuer un test de Kruskal-Wallis dans SPSS
Comment effectuer un test de Kruskal-Wallis dans Stata
Comment effectuer un test de Kruskal-Wallis dans SAS
Calculateur de test de Kruskal-Wallis en ligne