Comment calculer les centiles dans SAS : avec des exemples



Voici les trois façons les plus courantes de calculer les centiles d’un ensemble de données dans SAS :

Méthode 1 : calculer une valeur centile spécifique

/*calculate 70th percentile value for var1*/
proc univariate data=original_data;
    var var1;
    output out=percentile_data
    pctlpts = 70
    pctlpre = P_;
run;

Méthode 2 : calculer plusieurs valeurs centiles spécifiques

/*calculate 70th, 80th, and 90th percentile value for var1*/
proc univariate data=original_data;
    var var1;
    output out=percentile_data
    pctlpts = 70 80 90
    pctlpre = P_;
run;

Méthode 3 : calculer les percentiles par groupe

/*sort original data by var2*/
proc sort data=original_data;
    by var2;
run;

/*calculate percentiles for var1 grouped by var2*/
proc univariate data=original_data;
    var var1;
    by var2;
    output out=percentile_data
    pctlpts = 70, 80, 90
    pctlpre = P_;
run;

Remarque : L’instruction pctlpts spécifie les centiles à calculer et l’instruction pctlpre spécifie le préfixe à utiliser pour les centiles dans la sortie.

Les exemples suivants montrent comment utiliser chaque méthode avec l’ensemble de données suivant dans SAS :

/*create dataset*/
data original_data;
    input team $ points;
    datalines;
A 12
A 15
A 16
A 21
A 22
A 25
A 29
A 31
B 16
B 22
B 25
B 29
B 30
B 31
B 33
B 38
;
run;

/*view dataset*/
proc print data=original_data;

Exemple 1 : Calculer une valeur centile spécifique

Le code suivant montre comment calculer le 70e centile pour la variable points :

/*calculate 70th percentile value for points*/
proc univariate data=original_data;
    var points;
    output out=percentile_data
    pctlpts = 70
    pctlpre = P_;
run;

/*view results*/
proc print data=percentile_data;

La valeur au 70e percentile s’avère être 30 .

Exemple 2 : Calculer plusieurs valeurs de percentile spécifiques

Le code suivant montre comment calculer les valeurs aux 70e, 80e et 90e centiles pour la variable points :

/*calculate 70th, 80th, and 90th percentile value for points*/
proc univariate data=original_data;
    var points;
    output out=percentile_data
    pctlpts = 70 80 90
    pctlpre = P_;
run;

Voici comment interpréter le résultat :

  • La valeur au 70e percentile est 30 .
  • La valeur au 80e percentile est 31 .
  • La valeur au 90e percentile est 33 .

Exemple 3 : calculer les centiles par groupe

Le code suivant montre comment calculer les valeurs aux 70e, 80e, 90e et 95e centiles pour la variable points , regroupées par la variable équipe :

/*sort original data by team*/
proc sort data=original_data;
    by team;
run;

/*calculate percentiles for points grouped by team*/
proc univariate data=original_data;
    var points;
    by team;
    output out=percentile_data
    pctlpts = 70, 80, 90 95
    pctlpre = P_;
run;

Le tableau de sortie affiche les valeurs des 70e, 80e, 90e et 95e centiles pour la variable de points pour les équipes A et B.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment utiliser le résumé de procédure dans SAS
Comment créer des tableaux de fréquences dans SAS
Comment calculer la corrélation dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *