So erstellen sie häufigkeitstabellen in sas (mit beispielen)


Sie können proc freq in SAS verwenden, um schnell Häufigkeitstabellen für eine oder mehrere Variablen in einem Datensatz zu erstellen.

Die folgenden Beispiele zeigen, wie dieses Verfahren mit dem in SAS integrierten Datensatz namens BirthWgt verwendet wird, der verschiedene Merkmale von 100.000 Müttern enthält, die kürzlich entbunden haben.

Wir können proc print verwenden, um die ersten 10 Beobachtungen dieses Datensatzes anzuzeigen:

 /*view first 10 observations from BirthWgt dataset*/
proc print data =sashelp.BirthWgt( obs = 10 );

run ;

Beispiel 1: Häufigkeitstabelle für eine Variable

Mit dem folgenden Code können wir eine Häufigkeitstabelle für die Race-Variable erstellen:

 /*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
	Race tables ;
run ; 

Häufigkeitstabelle in SAS

Die Ausgabetabelle enthält vier Spalten:

  • Häufigkeit : Die Gesamtzahl der Beobachtungen, die zu einer bestimmten Kategorie gehören.
  • Prozentsatz : Der Prozentsatz aller Beobachtungen, die in eine bestimmte Kategorie fallen.
  • Kumulierte Häufigkeit : Gesamtzahl der Beobachtungen, die bis einschließlich der aktuellen Zeile berücksichtigt wurden.
  • Kumulativer Prozentsatz : Der kumulative Prozentsatz aller Beobachtungen, die bis einschließlich der aktuellen Zeile berücksichtigt wurden.

Aus der Ausgabetabelle können wir beispielsweise Folgendes ersehen:

  • Die Gesamtzahl hispanischer Mütter betrug 22.139 .
  • Der Gesamtanteil hispanischer Mütter betrug 22,14 % .
  • Die Gesamtzahl der asiatischen, schwarzen oder hispanischen Mütter betrug 41.496 .
  • Der kumulierte Anteil asiatischer, schwarzer oder hispanischer Mütter betrug 41,50 % .

Beispiel 2: Häufigkeitstabelle für eine Variable (sortiert)

Standardmäßig werden Häufigkeitstabellen alphabetisch nach Kategorienamen sortiert. Wir können jedoch die Bestellfunktion verwenden, um Kategorien nach Häufigkeit zu sortieren:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race tables ;
run ; 

Beachten Sie, dass die Kategorien jetzt nach Häufigkeit sortiert sind, von der höchsten zur niedrigsten.

Beispiel 3: Häufigkeitstabelle für eine Variable (fehlende Werte einschließen)

Standardmäßig werden fehlende Werte nicht in Häufigkeitstabellen berücksichtigt.

Allerdings können wir den Missing- Befehl verwenden, um SAS anzuweisen, eine Zeile einzufügen, um die Häufigkeit fehlender Werte zu zählen:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race/missing tables ;
run ; 

Da der Häufigkeitstabelle keine zusätzlichen Zeilen hinzugefügt wurden, bedeutet dies, dass im ursprünglichen Datensatz keine Werte für die Rasse fehlten.

Beispiel 4: Häufigkeitstabelle für mehrere Variablen

Um eine Häufigkeitstabelle für mehrere Variablen gleichzeitig zu erstellen, können wir einfach mehrere Variablennamen in das Tabellenargument aufnehmen.

Beispielsweise können wir den folgenden Code verwenden, um eine Häufigkeitstabelle für „Race“ und „AgeGroup“ zu erstellen:

 /*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race AgeGroup tables ;
run ; 

Wir können sehen, dass für beide Variablen eine Häufigkeitstabelle erstellt wurde.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert