Comment utiliser PROC STDIZE dans SAS (avec exemple)
Standardiser une variable signifie mettre à l’échelle chacune des valeurs de la variable de telle sorte que la valeur moyenne soit 0 et l’écart type soit 1.
Vous pouvez utiliser la formule suivante pour standardiser une variable
(x je – x ) / s
où:
- x i : la ième valeur de l’ensemble de données
- x : La moyenne de l’échantillon
- s : l’écart type de l’échantillon
Le moyen le plus simple de standardiser une variable dans SAS consiste à utiliser l’instruction PROC STDIZE .
L’exemple suivant montre comment utiliser cette instruction dans la pratique.
Exemple : Comment utiliser PROC STDIZE dans SAS
Supposons que nous ayons l’ensemble de données suivant dans SAS qui contient des informations sur divers joueurs de basket-ball :
/*create first dataset*/
data my_data;
input player $ points assists rebounds;
datalines;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run;
/*view dataset*/
proc print data=my_data;
Nous pouvons utiliser l’instruction PROC STDIZE pour créer un nouvel ensemble de données qui standardise chacune des variables numériques de l’ensemble de données :
/*standardize all numeric variables in dataset*/
proc stdize data=my_data out=std_data;
run;
/*view new dataset*/
proc print data=std_data;
Chacune des variables numériques (points, passes décisives, rebonds) a été standardisée pour avoir une moyenne de 0 et un écart type de 1.
Notez que nous pouvons également utiliser l’instruction VAR pour spécifier les variables à normaliser.
Par exemple, nous pouvons utiliser l’instruction PROC STDIZE suivante avec l’instruction VAR pour normaliser uniquement la variable points :
/*standardize points variable in dataset*/
proc stdize data=my_data out=std_data;
var points;
run;
/*view new dataset*/
proc print data=std_data;
Les valeurs de la colonne des points ont été standardisées tandis que toutes les autres colonnes sont restées intactes.
Nous pouvons utiliser l’instruction PROC MEANS pour vérifier que la variable points a désormais une valeur moyenne de 0 et un écart type de 1 :
/*view mean and standard deviation of each variable*/ proc means data=std_data;
On voit que la variable points a bien une valeur moyenne de 0 et un écart type de 1.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment supprimer des lignes avec des valeurs manquantes dans SAS
Comment calculer l’écart type dans SAS (3 exemples)
Comment calculer les scores Z dans SAS