Comment utiliser Proc Tabulate dans SAS (avec exemples)



Vous pouvez utiliser proc tabulate dans SAS pour afficher rapidement des statistiques descriptives pour une ou plusieurs variables sous forme de tableau.

Les exemples suivants montrent comment utiliser cette procédure avec l’ensemble de données suivant qui montre le total des points marqués par 12 joueurs de basket-ball différents :

/*create dataset*/
data my_data;
    input team $ position $ points;
    datalines;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run;

/*view dataset*/
proc print data=my_data;

Exemple 1 : Proc Tabulate avec une variable

Nous pouvons utiliser le code suivant pour calculer des statistiques descriptives pour la variable points :

/*create table that displays descriptive stats for points variable*/
proc tabulate data=my_data;
    var points;
    table points * (N Min Q1 Median Mean Q3 Max);
run; 

Remarque : Les valeurs entre parenthèses indiquent à SAS quelles statistiques descriptives calculer pour les points.

Voici quelques-unes des statistiques descriptives les plus couramment utilisées :

  • N : Le nombre total d’observations
  • Min : La valeur minimale
  • Q1 : La valeur du premier quantile (soit le 25ème centile)
  • Médiane : La valeur médiane
  • Moyenne : La valeur moyenne
  • Q3 : La valeur du troisième quantile (soit le 75ème percentile)
  • Max : La valeur maximale

À partir du résultat, nous pouvons voir :

  • Le total des observations est de 12 .
  • La valeur minimale des points est de 3 .
  • Le nombre de points au 25e percentile est de 10,5 .
  • Le nombre médian de points est de 15,5 .
  • Le nombre moyen de points est de 16,92 .
  • Le nombre de points au 75e percentile est de 22,5 .
  • Le nombre maximum de points est de 34 .

À partir de ces cinq valeurs, nous pouvons acquérir une assez bonne compréhension de la distribution des valeurs de la variable Poids.

Exemple 2 : Proc Tabulate avec deux variables

Nous pouvons utiliser le code suivant pour calculer des statistiques descriptives pour la variable points, regroupées par la variable équipe :

/*create table that displays descriptive stats for points, grouped by team*/
proc tabulate data=my_data;
    class team;
    var points;
    table team, points * (N Min Q1 Median Mean Q3 Max);
run; 

Le tableau résultant montre les statistiques descriptives des points pour chacune des trois équipes.

Par exemple:

  • L’équipe A a 6 observations.
  • La valeur minimale des points pour l’équipe A est de 9 .
  • Le nombre de points de l’équipe A au 25e centile est de 12 .
  • Le nombre médian de points de l’équipe A est de 14 .

Et ainsi de suite.

Exemple 3 : Proc Tabulate avec trois variables

Nous pouvons utiliser le code suivant pour calculer des statistiques descriptives pour la variable points, regroupées par variables d’équipe et de position :

/*create table that shows descriptive stats for points, grouped by team and position*/
proc tabulate data=my_data;
    class team position;
    var points;
    table team, position * points * (N Min Q1 Median Mean Q3 Max);
run; 

Le tableau résultant montre les statistiques descriptives des points, regroupés par équipe et position.

Notez que les cellules pour l’équipe « B » et la position « Attaquant » sont vides car aucun joueur de l’équipe B n’avait une position d’Attaquant.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment utiliser le résumé de procédure dans SAS
Comment calculer la corrélation dans SAS
Comment créer des tableaux de fréquences dans SAS
Comment créer des boxplots par groupe dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *