Proc-tabellen gebruiken in sas (met voorbeelden)
U kunt proc-tabellen in SAS gebruiken om snel beschrijvende statistieken voor een of meer variabelen in tabelvorm weer te geven.
De volgende voorbeelden laten zien hoe u deze procedure kunt gebruiken met de volgende gegevensset die het totaal aantal punten weergeeft dat door twaalf verschillende basketbalspelers is gescoord:
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/*view dataset*/
proc print data =my_data;
Voorbeeld 1: Proc Tabelleren met een variabele
We kunnen de volgende code gebruiken om beschrijvende statistieken voor de puntenvariabele te berekenen:
/*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
var points;
table points * (N Min Q1 Median Mean Q3 Max);
run ;
Opmerking : Waarden tussen haakjes vertellen SAS welke beschrijvende statistieken voor de punten moeten worden berekend.
Hier zijn enkele van de meest gebruikte beschrijvende statistieken:
- N : Het totale aantal waarnemingen
- Min : De minimumwaarde
- Q1 : De waarde van het eerste kwantiel (dwz het 25e percentiel)
- Mediaan : de mediaanwaarde
- Gemiddelde : de gemiddelde waarde
- Q3 : De waarde van het derde kwantiel (dwz het 75e percentiel)
- Max : de maximale waarde
Uit het resultaat kunnen we zien:
- Het totaal aantal waarnemingen bedraagt 12 .
- De minimale puntwaarde is 3 .
- Het aantal punten op het 25e percentiel bedraagt 10,5 .
- Het mediaan aantal punten bedraagt 15,5 .
- Het gemiddelde aantal punten bedraagt 16,92 .
- Het aantal punten op het 75e percentiel bedraagt 22,5 .
- Het maximale aantal punten bedraagt 34 .
Uit deze vijf waarden kunnen we een redelijk goed inzicht krijgen in de verdeling van waarden voor de variabele Gewicht.
Voorbeeld 2: Proc Tabelleren met twee variabelen
We kunnen de volgende code gebruiken om beschrijvende statistieken te berekenen voor de puntenvariabele, gegroepeerd op de teamvariabele:
/*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
classteam ;
var points;
table team, points * (N Min Q1 Median Mean Q3 Max);
run ;
De resulterende tabel toont de beschrijvende puntstatistieken voor elk van de drie teams.
Bijvoorbeeld:
- Team A heeft 6 observaties.
- De minimale puntenwaarde voor team A is 9 .
- Het aantal punten van team A op het 25e percentiel is 12 .
- Het gemiddelde aantal punten van team A is 14 .
Enzovoort.
Voorbeeld 3: Proc-tabel met drie variabelen
We kunnen de volgende code gebruiken om beschrijvende statistieken te berekenen voor de puntenvariabele, gegroepeerd op team- en positievariabelen:
/*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
var points;
table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ;
De resulterende tabel toont de beschrijvende statistieken van de punten, gegroepeerd per team en positie.
Merk op dat de cellen voor Team „B“ en de „Aanvaller“-positie leeg zijn, omdat geen enkele speler van Team B een Aanvaller-positie had.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Procedureoverzicht gebruiken in SAS
Hoe de correlatie in SAS te berekenen
Hoe frequentietabellen in SAS te maken
Boxplots per groep maken in SAS