Comment calculer des statistiques descriptives dans SAS



Les statistiques descriptives sont des valeurs qui décrivent un ensemble de données.

Ils nous aident à comprendre où se trouve le centre de l’ensemble de données ainsi que la répartition des valeurs dans l’ensemble de données.

Il existe deux manières courantes de calculer des statistiques descriptives pour les variables dans SAS :

1. Utilisez PROC MEANS pour calculer les statistiques récapitulatives

2. Utilisez PROC UNIVARIATE pour calculer des statistiques descriptives détaillées

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec l’ensemble de données suivant dans SAS :

/*create dataset*/
data my_data;
    input team $ points assists;
    datalines;
A 10 2
A 17 5
A 17 6
A 18 3
A 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run;

/*view dataset*/
proc print data=my_data;

Exemple 1. Utiliser PROC MEANS pour calculer des statistiques récapitulatives

Le code suivant montre comment utiliser PROC MEANS pour calculer des statistiques récapitulatives pour la variable points dans l’ensemble de données :

/*calculate summary statistics for points variable*/
proc means data=my_data;
    var points;
run;

statistiques descriptives dans SAS utilisant PROC MEANS

La procédure PROC MEANS calcule les statistiques descriptives suivantes :

  • N : Le nombre total d’observations
  • Moyenne : La valeur moyenne des points
  • Std Dev : l’écart type des points
  • Minimum : La valeur minimale des points
  • Maximum : La valeur maximale des points

Notez également que vous pouvez utiliser l’instruction class pour calculer des statistiques descriptives pour une variable, regroupées par une autre variable.

Par exemple, nous pouvons utiliser le code suivant pour calculer des statistiques récapitulatives pour la variable points , regroupées par la variable équipe :

/*calculate summary statistics for points, grouped by team*/
proc means data=my_data;
    class team;
    var points;
run;

La sortie affiche les statistiques récapitulatives de la variable de points , regroupées par chacune des valeurs d’équipe uniques .

Exemple 2. Utilisez PROC UNIVARIATE pour calculer des statistiques descriptives détaillées

Le code suivant montre comment utiliser PROC UNIVARIATE pour calculer des statistiques descriptives détaillées pour la variable points :

/*calculate detailed descriptive statistics for points variable*/
proc univariate data=my_data;
    var points;
run;

La procédure PROC UNIVARIATE calcule des statistiques descriptives détaillées pour la variable de points , notamment la moyenne, la médiane, le mode, l’écart type, la variance, l’intervalle, l’intervalle interquartile, etc.

Nous pouvons également utiliser l’instruction class pour calculer ces statistiques descriptives détaillées pour la variable points , regroupées par la variable équipe :

/*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data=my_data;
    class team;
    var points;
run;

Cela produira trois groupes de tableaux de sortie qui affichent des statistiques descriptives détaillées pour la variable de points , regroupées par chacune des valeurs uniques de l’équipe .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment créer des tableaux de fréquences dans SAS
Comment calculer les centiles dans SAS
Comment créer des tableaux croisés dynamiques dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *