Comment utiliser le contenu Proc dans SAS (avec exemples)



Vous pouvez utiliser le contenu de la procédure dans SAS pour imprimer un résumé du contenu d’un ensemble de données.

L’exemple suivant montre comment utiliser cette procédure dans la pratique.

Exemple : utilisation du contenu Proc dans SAS

Supposons que nous ayons l’ensemble de données suivant dans SAS qui contient des informations sur divers joueurs de basket-ball :

/*create dataset*/
data original_data;
    input team $ points rebounds;
    datalines;
A 12 8
A 12 8
A 12 8
A 23 9
A 20 12
A 14 7
A 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run;

/*view dataset*/
proc print data=original_data;

Nous pouvons utiliser proc contents pour obtenir un résumé du contenu de l’ensemble de données :

/*view contents of dataset*/
proc contents data=original_data;

Le premier tableau de la sortie affiche diverses informations sur l’ensemble de données, mais les valeurs les plus utiles incluent :

  • Data Set Name : Le nom de l’ensemble de données (original_data)
  • Observations : Le nombre de lignes dans l’ensemble de données (14)
  • Variables : Le nombre de colonnes dans l’ensemble de données (3)

Le deuxième tableau de la sortie affiche des informations sur le moteur et l’hôte utilisés dans SAS. Dans la plupart des cas, ces informations ne vous seront pas particulièrement utiles.

Le troisième tableau affiche une liste alphabétique des variables de l’ensemble de données ainsi que leur type et leur longueur de données.

De ce tableau nous pouvons voir :

  • les points sont une variable numérique
  • les rebonds sont une variable numérique
  • l’équipe est une variable de caractère

Si vous souhaitez plutôt que ces variables soient affichées dans l’ordre dans lequel elles apparaissent dans l’ensemble de données, vous pouvez utiliser order=varnum comme suit :

/*view contents of dataset and retain original order of variables*/
proc contents data=original_data order=varnum;

Le troisième tableau de sortie affichera désormais une liste de variables dans l’ordre dans lequel elles apparaissent dans l’ensemble de données :

Conclusion

Dans ce tutoriel, nous avons vu que le contenu de la procédure peut être utilisé dans SAS pour obtenir un résumé du contenu d’un ensemble de données.

En particulier, nous avons vu que proc contents est utile pour obtenir les informations suivantes :

  • La taille d’un ensemble de données (nombre de colonnes et de lignes)
  • Les noms et le type de données de chaque variable de l’ensemble de données

En pratique, nous utilisons souvent le contenu de la procédure avant d’effectuer tout type d’analyse statistique, simplement pour mieux comprendre la taille et la structure d’un ensemble de données.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment utiliser le résumé de procédure dans SAS
Comment utiliser Proc Tabulate dans SAS
Comment utiliser le classement Proc dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *