SAS : Comment utiliser Proc Univariate pour les tests de normalité
Vous pouvez utiliser proc univariate dans SAS avec l’instruction normale pour effectuer plusieurs tests de normalité sur une variable d’un ensemble de données.
Cette procédure utilise la syntaxe de base suivante :
proc univariate data=my_data normal;
var my_variable;
run;
L’exemple suivant montre comment utiliser cette procédure dans la pratique.
Exemple : Proc Univariate pour les tests de normalité dans SAS
Supposons que nous ayons l’ensemble de données suivant dans SAS qui contient des informations sur divers joueurs de basket-ball :
/*create dataset*/
data my_data;
input team $ points rebounds;
datalines;
A 12 8
A 12 8
A 12 8
A 23 9
A 20 12
A 14 7
A 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run;
/*view dataset*/
proc print data=my_data;
Nous pouvons utiliser proc univariate avec l’instruction normale pour effectuer divers tests de normalité sur la variable points :
proc univariate data=my_data normal;
var points;
run;
Plusieurs tableaux seront affichés dans le résultat, mais celui intitulé Tests de normalité contient les résultats des tests de normalité :
Par défaut, SAS effectue quatre tests de normalité et affiche chacune de leurs statistiques de test et les valeurs p correspondantes :
- Test de Shapiro-Wilk : W = 0,867, p = 0,0383
- Test de Kolmogorov-Smirnov : D = .237, p = .0318
- Test de Cramer-von Mises : W-Sq = 0,152, p = 0,0200
- Test d’Anderson-Darling : A-Sq = 0,847, p = 0,0223
Chaque test de normalité utilise les hypothèses nulles et alternatives suivantes :
- H 0 : Les données sont normalement distribuées.
- H A : Les données ne sont pas normalement distribuées.
Étant donné que la valeur p pour chaque test de normalité est inférieure à 0,05, nous rejetterions l’hypothèse nulle pour chaque test de normalité.
Cela signifie qu’il existe suffisamment de preuves pour conclure que la variable de points n’est pas distribuée normalement.
Notez que vous pouvez également créer un histogramme avec une courbe normale superposée pour visualiser la distribution des valeurs de la variable points :
proc univariate data=my_data;
histogram points / normal;
run;
L’histogramme nous montre que la distribution des valeurs ne suit pas très bien la courbe normale, ce qui concorde avec les résultats des tests de normalité que nous avons effectués.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment utiliser le résumé de procédure dans SAS
Comment utiliser Proc Tabulate dans SAS
Comment utiliser le classement Proc dans SAS