Verwendung von proc tabulate in sas (mit beispielen)


Sie können proc tabulate in SAS verwenden, um schnellbeschreibende Statistiken für eine oder mehrere Variablen in Tabellenform anzuzeigen.

Die folgenden Beispiele zeigen, wie dieses Verfahren mit dem folgenden Datensatz verwendet wird, der die Gesamtpunktzahl von 12 verschiedenen Basketballspielern zeigt:

 /*create dataset*/
data my_data;
    input team $position $points;
    datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;

/*view dataset*/
proc print data =my_data;

Beispiel 1: Proc Tabulate mit einer Variablen

Wir können den folgenden Code verwenden, um deskriptive Statistiken für die Punktevariable zu berechnen:

 /*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
    var points;
    table points * (N Min Q1 Median Mean Q3 Max);
run ; 

Hinweis : Die Werte in Klammern sagen SAS, welche deskriptiven Statistiken für die Punkte berechnet werden sollen.

Hier sind einige der am häufigsten verwendeten deskriptiven Statistiken:

  • N : Die Gesamtzahl der Beobachtungen
  • Min : Der Mindestwert
  • Q1 : Der Wert des ersten Quantils (d. h. des 25. Perzentils)
  • Median : Der Medianwert
  • Durchschnitt : Der Durchschnittswert
  • Q3 : Der Wert des dritten Quantils (d. h. des 75. Perzentils)
  • Max : Der Maximalwert

Aus dem Ergebnis können wir sehen:

  • Die Gesamtzahl der Beobachtungen beträgt 12 .
  • Der Mindestpunktwert beträgt 3 .
  • Die Punktzahl beim 25. Perzentil beträgt 10,5 .
  • Die mittlere Punktzahl liegt bei 15,5 .
  • Die durchschnittliche Punktzahl beträgt 16,92 .
  • Die Punktzahl beim 75. Perzentil beträgt 22,5 .
  • Die maximale Punktzahl beträgt 34 .

Anhand dieser fünf Werte können wir ein ziemlich gutes Verständnis der Werteverteilung für die Variable „Gewicht“ gewinnen.

Beispiel 2: Proc Tabulate mit zwei Variablen

Mit dem folgenden Code können wir deskriptive Statistiken für die Punktevariable, gruppiert nach der Teamvariable, berechnen:

 /*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
    classteam ;
    var points;
    table team, points * (N Min Q1 Median Mean Q3 Max);
run ; 

Die resultierende Tabelle zeigt die beschreibende Punktestatistik für jedes der drei Teams.

Zum Beispiel:

  • Team A hat 6 Beobachtungen.
  • Der Mindestpunktwert für Team A beträgt 9 .
  • Die Punktzahl von Team A beim 25. Perzentil beträgt 12 .
  • Die durchschnittliche Punktzahl von Team A beträgt 14 .

Und so weiter.

Beispiel 3: Proc Tabulate mit drei Variablen

Mit dem folgenden Code können wir deskriptive Statistiken für die Punktevariable, gruppiert nach Team- und Positionsvariablen, berechnen:

 /*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
    var points;
    table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ; 

Die resultierende Tabelle zeigt die deskriptive Statistik der Punkte, gruppiert nach Team und Position.

Beachten Sie, dass die Zellen für Team „B“ und die Position „Angreifer“ leer sind, da kein Spieler in Team B eine Angreiferposition hatte.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So verwenden Sie die Verfahrenszusammenfassung in SAS
So berechnen Sie die Korrelation in SAS
So erstellen Sie Häufigkeitstabellen in SAS
So erstellen Sie Boxplots nach Gruppen in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert