So berechnen sie deskriptive statistiken in sas
Beschreibende Statistiken sind Werte, die einen Datensatz beschreiben.
Sie helfen uns zu verstehen, wo sich das Zentrum des Datensatzes befindet und wie die Werte im Datensatz verteilt sind.
Es gibt zwei gängige Methoden zur Berechnung deskriptiver Statistiken für Variablen in SAS:
1. Verwenden Sie PROC MEANS , um zusammenfassende Statistiken zu berechnen
2. Verwenden Sie PROC UNIVARIATE , um detaillierte deskriptive Statistiken zu berechnen
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datensatz in SAS verwendet wird:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
Beispiel 1. Verwenden Sie PROC MEANS, um zusammenfassende Statistiken zu berechnen
Der folgende Code zeigt, wie PROC MEANS verwendet wird, um zusammenfassende Statistiken für die Punktevariable im Datensatz zu berechnen:
/*calculate summary statistics for points variable*/ proc means data =my_data; var points; run ;
Die PROC MEANS -Prozedur berechnet die folgenden deskriptiven Statistiken:
- N : Die Gesamtzahl der Beobachtungen
- Durchschnitt : Der Durchschnittswert der Punkte
- Std Dev: die Standardabweichung der Punkte
- Minimum : Der Mindestpunktwert
- Maximum : Der maximale Punktwert
Beachten Sie außerdem, dass Sie die Klassenanweisung verwenden können, um deskriptive Statistiken für eine Variable zu berechnen, gruppiert nach einer anderen Variablen.
Beispielsweise können wir den folgenden Code verwenden, um zusammenfassende Statistiken für die Punktevariable , gruppiert nach der Teamvariable , zu berechnen:
/*calculate summary statistics for points, grouped by team*/ proc means data =my_data; classteam ; var points; run ;
Die Ausgabe zeigt zusammenfassende Statistiken für die Punktevariable an, gruppiert nach jedem der eindeutigen Teamwerte .
Beispiel 2. Verwenden Sie PROC UNIVARIATE, um detaillierte deskriptive Statistiken zu berechnen
Der folgende Code zeigt, wie Sie PROC UNIVARIATE verwenden, um detaillierte deskriptive Statistiken für die Punktevariable zu berechnen:
/*calculate detailed descriptive statistics for points variable*/ proc univariate data =my_data; var points; run ;
Die Prozedur PROC UNIVARIATE berechnet detaillierte deskriptive Statistiken für die Punktvariable , einschließlich Mittelwert, Median, Modus, Standardabweichung, Varianz, Bereich, Interquartilbereich usw.
Wir können die Klassenanweisung auch verwenden, um diese detaillierten deskriptiven Statistiken für die Punktevariable , gruppiert nach der Teamvariable , zu berechnen:
/*calculate detailed descriptive statistics for points, grouped by team*/ proc univariate data =my_data; classteam ; var points; run ;
Dadurch werden drei Gruppen von Ausgabetabellen erstellt, die detaillierte deskriptive Statistiken für die Punktevariable anzeigen, gruppiert nach den einzelnen Werten des Teams .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:
So erstellen Sie Häufigkeitstabellen in SAS
So berechnen Sie Perzentile in SAS
So erstellen Sie PivotTables in SAS