Comment créer des tableaux de fréquences dans SAS (avec exemples)
Vous pouvez utiliser proc freq dans SAS pour créer rapidement des tableaux de fréquence pour une ou plusieurs variables d’un ensemble de données.
Les exemples suivants montrent comment utiliser cette procédure avec l’ensemble de données intégré SAS appelé BirthWgt , qui contient diverses caractéristiques de 100 000 mères ayant récemment accouché.
Nous pouvons utiliser proc print pour afficher les 10 premières observations de cet ensemble de données :
/*view first 10 observations from BirthWgt dataset*/ proc print data=sashelp.BirthWgt (obs=10); run;
Exemple 1 : Tableau de fréquence pour une variable
Nous pouvons utiliser le code suivant pour créer une table de fréquence pour la variable Race :
/*create frequency table for Race variable*/
proc freq data=sashelp.BirthWgt;
tables Race;
run;
Le tableau de sortie contient quatre colonnes :
- Fréquence : le nombre total d’observations appartenant à une certaine catégorie.
- Pourcentage : le pourcentage du total des observations qui entrent dans une certaine catégorie.
- Fréquence cumulée : nombre total d’observations qui ont été prises en compte jusqu’à la ligne actuelle incluse.
- Pourcentage cumulé : le pourcentage cumulé du total des observations qui ont été prises en compte jusqu’à la ligne actuelle incluse.
Par exemple, à partir du tableau de sortie, nous pouvons voir :
- Le nombre total de mères hispaniques était de 22 139 .
- Le pourcentage total de mères hispaniques était de 22,14 % .
- Le nombre total de mères asiatiques, noires ou hispaniques était de 41 496 .
- Le pourcentage cumulé de mères asiatiques, noires ou hispaniques était de 41,50 % .
Exemple 2 : Tableau de fréquence pour une variable (triée)
Par défaut, les tableaux de fréquences sont triés par ordre alphabétique en fonction des noms de catégories. Cependant, nous pouvons utiliser la fonction order pour trier les catégories par fréquence :
/*create frequency table for Race variable, sorted by frequency*/
proc freq data=sashelp.BirthWgt order=freq;
tables Race;
run;
Notez que les catégories sont désormais triées en fonction de la fréquence, de la plus élevée à la plus basse.
Exemple 3 : Tableau de fréquence pour une variable (inclure les valeurs manquantes)
Par défaut, les valeurs manquantes ne sont pas incluses dans les tableaux de fréquence.
Cependant, nous pouvons utiliser la commande manquante pour demander à SAS d’inclure une ligne pour compter la fréquence des valeurs manquantes :
/*create frequency table for Race variable, sorted by frequency*/
proc freq data=sashelp.BirthWgt order=freq;
tables Race / missing;
run;
Puisqu’aucune ligne supplémentaire n’a été ajoutée au tableau de fréquence, cela nous indique qu’il n’y avait aucune valeur manquante pour la race dans l’ensemble de données d’origine.
Exemple 4 : Tableau de fréquence pour plusieurs variables
Pour créer un tableau de fréquence pour plusieurs variables à la fois, nous pouvons simplement inclure plusieurs noms de variables dans l’argument tables .
Par exemple, nous pouvons utiliser le code suivant pour créer un tableau de fréquence pour Race et AgeGroup :
/*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data=sashelp.BirthWgt order=freq;
tables Race AgeGroup;
run;
Nous pouvons voir qu’un tableau de fréquence a été créé pour les deux variables.