Comment utiliser le résumé de procédure dans SAS (avec exemples)



Vous pouvez utiliser le résumé de procédure dans SAS pour calculer rapidement les statistiques descriptives suivantes pour une ou plusieurs variables d’un ensemble de données :

  • N : Le nombre total d’observations
  • MIN : La valeur minimale
  • MAX : La valeur maximale
  • MOYENNE : La moyenne
  • STD : L’écart type

Les exemples suivants montrent comment utiliser cette procédure avec l’ensemble de données intégré SAS appelé Fish , qui contient diverses mesures pour 159 poissons différents capturés dans un lac en Finlande.

Nous pouvons utiliser proc print pour afficher les 10 premières observations de cet ensemble de données :

/*view first 10 observations from Fish dataset*/
proc print data=sashelp.Fish (obs=10);

run;

Connexes : Comment identifier les valeurs aberrantes dans SAS

Exemple 1 : Résumé de procédure avec une variable

Nous pouvons utiliser le code suivant pour calculer des statistiques descriptives pour la variable Weight :

/*calculate descriptive statistics for Weight variable*/
proc summary data=sashelp.Fish;
   var Weight;
   output out=summaryWeight;
run;

/*print output dataset*/
proc print data=summaryWeight;

Voici comment interpréter le tableau de sortie :

  • _TYPE_ : cette colonne indique si chaque ligne de l’ensemble de données a été utilisée ou non pour calculer les statistiques descriptives. 0 = Chaque ligne a été utilisée.
  • _FREQ_ : Le nombre de lignes utilisées pour calculer chaque statistique descriptive.
  • _STAT_ : Le nom de la statistique descriptive.
  • Poids : la valeur numérique de la statistique descriptive correspondante.

À partir du résultat, nous pouvons voir :

  • Le nombre total d’ observations était de 158 .
  • La valeur de poids minimale était 0 .
  • La valeur maximale du poids était de 1 650 .
  • La valeur moyenne du poids était de 398,70 .
  • L’écart type des valeurs de poids était de 359,09 .

À partir de ces cinq valeurs, nous pouvons acquérir une assez bonne compréhension de la distribution des valeurs de la variable Poids.

Exemple 2 : Résumé du processus avec plusieurs variables

Pour calculer des statistiques descriptives pour plusieurs variables à la fois, répertoriez simplement plusieurs noms de variables dans l’instruction var .

Par exemple, nous pouvons utiliser le code suivant pour calculer des statistiques descriptives pour les variables Poids et Taille :

/*calculate descriptive statistics for Weight and Height variables*/
proc summary data=sashelp.Fish;
   var Weight Height;
   output out=summaryWeightHeight;
run;

/*print output dataset*/
proc print data=summaryWeightHeight;

À partir du résultat, nous pouvons voir les cinq statistiques descriptives pour le poids et la taille.

Exemple 3 : Résumé du processus avec une variable regroupée par une autre variable

Pour calculer des statistiques descriptives pour une variable regroupée par une autre variable, nous pouvons utiliser l’instruction class .

Par exemple, nous pouvons utiliser le code suivant pour calculer des statistiques descriptives pour le poids regroupé par espèce :

/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data=sashelp.Fish;
   var Weight;
   class Species;
   output out=summaryWeightSpecies;
run;

/*print output dataset*/
proc print data=summaryWeightSpecies;

Le tableau de sortie affiche les statistiques descriptives pour chaque espèce de poisson.

Par exemple, nous pouvons observer les statistiques descriptives suivantes pour le seul poisson Brème :

  • Le nombre total d’ observations était de 34 .
  • La valeur de poids minimale était de 242 .
  • La valeur maximale du poids était de 1 000 .
  • La valeur moyenne du poids était de 626 .
  • L’écart type des valeurs de poids était de 206,60 .

Nous pouvons également observer ces statistiques descriptives pour toutes les autres espèces.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment utiliser Proc Append dans SAS
Comment utiliser Proc Tabulate dans SAS
Comment calculer la corrélation dans SAS
Comment créer des tableaux de fréquences dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *