Comment effectuer un test de Kruskal-Wallis dans SAS
Un test de Kruskal-Wallis est utilisé pour déterminer s’il existe ou non une différence statistiquement significative entre les médianes de trois groupes indépendants ou plus.
Elle est considérée comme l’équivalent non paramétrique de l’ ANOVA unidirectionnelle .
Ce didacticiel fournit un exemple étape par étape de la façon d’effectuer un test de Kruskal-Wallis dans SAS.
Étape 1 : Saisissez les données
Supposons que les chercheurs souhaitent savoir si trois engrais différents conduisent à différents niveaux de croissance des plantes.
Ils sélectionnent au hasard 30 plantes différentes et les divisent en trois groupes de 10, en appliquant un engrais différent à chaque groupe. Au bout d’un mois, ils mesurent la hauteur de chaque plante.
Nous entrerons les données suivantes dans SAS, qui montrent la croissance totale (en pouces) de chacune des 10 plantes de chaque groupe :
/*create dataset*/
data fertilizer_data;
input fertilizer $ growth;
datalines;
fert1 7
fert1 14
fert1 14
fert1 13
fert1 12
fert1 9
fert1 6
fert1 14
fert1 12
fert1 8
fert2 15
fert2 17
fert2 13
fert2 15
fert2 15
fert2 13
fert2 9
fert2 12
fert2 10
fert2 8
fert3 6
fert3 8
fert3 8
fert3 9
fert3 5
fert3 14
fert3 13
fert3 8
fert3 10
fert3 9
;
run;
Étape 2 : Effectuer le test de Kruskal-Wallis
Ensuite, nous utiliserons l’instruction proc npar1way pour effectuer un test de Kruskal-Wallis afin de comparer la croissance médiane des plantes entre les trois groupes d’engrais :
/*perform Kruskal-Wallis test*/
proc npar1way data=fertilizer_data wilcoxon dscf;
class fertilizer;
var growth;
run;
Étape 3 : Interpréter les résultats
Le premier tableau du résultat montre la statistique globale du test du Chi carré et la valeur p correspondante pour le test de Kruskal-Wallis :
La valeur p du test est de 0,0431 . Puisque cette valeur est inférieure à 0,05, nous rejetons l’hypothèse nulle selon laquelle la croissance médiane des plantes est la même pour les trois engrais.
Cela signifie que nous disposons de suffisamment de preuves pour conclure que le type d’engrais utilisé entraîne des différences statistiquement significatives dans la croissance des plantes.
Le dernier tableau du résultat montre les valeurs p pour les comparaisons par paires entre chacun des trois groupes :
À partir de ce tableau, nous pouvons voir que la seule valeur p inférieure à 0,05 est la comparaison entre l’engrais 2 et l’engrais 3, qui a une valeur p de 0,0390 .
Cela signifie qu’il existe une différence statistiquement significative dans la croissance des plantes entre l’engrais 2 et l’engrais 3, mais pas entre les autres comparaisons par paires.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tests statistiques courants dans SAS :
Comment effectuer un test t sur un échantillon dans SAS
Comment effectuer un test t à deux échantillons dans SAS
Comment effectuer une ANOVA unidirectionnelle dans SAS
Comment effectuer une ANOVA bidirectionnelle dans SAS