Verwendung der verfahrenszusammenfassung in sas (mit beispielen)
Sie können die Prozedurzusammenfassung in SAS verwenden, um schnell die folgendenbeschreibenden Statistiken für eine oder mehrere Variablen in einem Datensatz zu berechnen:
- N : Die Gesamtzahl der Beobachtungen
- MIN : Der Mindestwert
- MAX : Der Maximalwert
- DURCHSCHNITT : Der Durchschnitt
- STD : Standardabweichung
Die folgenden Beispiele zeigen, wie dieses Verfahren mit dem in SAS integrierten Datensatz „Fish“ verwendet wird, der verschiedene Messungen für 159 verschiedene Fische enthält, die in einem See in Finnland gefangen wurden.
Wir können proc print verwenden, um die ersten 10 Beobachtungen dieses Datensatzes anzuzeigen:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Verwandte Themen: So identifizieren Sie Ausreißer in SAS
Beispiel 1: Zusammenfassung der Prozedur mit einer Variablen
Wir können den folgenden Code verwenden, um deskriptive Statistiken für die Variable „Gewicht“ zu berechnen:
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
So interpretieren Sie die Ausgabetabelle:
- _TYPE_: Diese Spalte gibt an, ob jede Zeile im Datensatz zur Berechnung deskriptiver Statistiken verwendet wurde oder nicht. 0 = Jede Zeile wurde verwendet.
- _FREQ_: Die Anzahl der Zeilen, die zur Berechnung jeder beschreibenden Statistik verwendet werden.
- _STAT_: Der Name der beschreibenden Statistik.
- Gewicht: der numerische Wert der entsprechenden beschreibenden Statistik.
Aus dem Ergebnis können wir sehen:
- Die Gesamtzahl der Beobachtungen betrug 158 .
- Der Mindestgewichtswert war 0 .
- Der maximale Gewichtswert betrug 1.650 .
- Der durchschnittliche Gewichtswert betrug 398,70 .
- Die Standardabweichung der Gewichtswerte betrug 359,09 .
Anhand dieser fünf Werte können wir ein ziemlich gutes Verständnis der Werteverteilung für die Variable „Gewicht“ gewinnen.
Beispiel 2: Prozesszusammenfassung mit mehreren Variablen
Um beschreibende Statistiken für mehrere Variablen gleichzeitig zu berechnen, listen Sie einfach mehrere Variablennamen in der var- Anweisung auf.
Beispielsweise können wir den folgenden Code verwenden, um deskriptive Statistiken für die Variablen Gewicht und Größe zu berechnen:
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
Aus dem Ergebnis können wir die fünf deskriptiven Statistiken für Gewicht und Größe erkennen.
Beispiel 3: Zusammenfassung des Prozesses mit einer Variablen gruppiert durch eine andere Variable
Um deskriptive Statistiken für eine durch eine andere Variable gruppierte Variable zu berechnen, können wir die Klassenanweisung verwenden.
Beispielsweise können wir den folgenden Code verwenden, um deskriptive Statistiken für das nach Arten gruppierte Gewicht zu berechnen:
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
Die Ausgabetabelle zeigt beschreibende Statistiken für jede Fischart an.
Beispielsweise können wir allein für den Brassenfisch die folgenden deskriptiven Statistiken beobachten:
- Die Gesamtzahl der Beobachtungen betrug 34 .
- Der Mindestgewichtswert betrug 242 .
- Der maximale Gewichtswert betrug 1000 .
- Der durchschnittliche Gewichtswert betrug 626 .
- Die Standardabweichung der Gewichtswerte betrug 206,60 .
Wir können diese deskriptiven Statistiken auch für alle anderen Arten beobachten.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:
So verwenden Sie Proc Append in SAS
So verwenden Sie Proc Tabulate in SAS
So berechnen Sie die Korrelation in SAS
So erstellen Sie Häufigkeitstabellen in SAS