Procedureoverzicht gebruiken in sas (met voorbeelden)
U kunt Proceduresamenvatting in SAS gebruiken om snel de volgende beschrijvende statistieken te berekenen voor een of meer variabelen in een gegevensset:
- N : Het totale aantal waarnemingen
- MIN : De minimumwaarde
- MAX : De maximale waarde
- GEMIDDELDE : Het gemiddelde
- SOA : standaarddeviatie
In de volgende voorbeelden ziet u hoe u deze procedure kunt gebruiken met de ingebouwde SAS-gegevensset Fish , die verschillende metingen bevat voor 159 verschillende vissen die zijn gevangen in een meer in Finland.
We kunnen proc print gebruiken om de eerste 10 waarnemingen van deze dataset weer te geven:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Gerelateerd: Hoe u uitschieters in SAS kunt identificeren
Voorbeeld 1: Samenvatting van de procedure met een variabele
We kunnen de volgende code gebruiken om beschrijvende statistieken voor de variabele Gewicht te berekenen:
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Zo interpreteert u de uitvoertabel:
- _TYPE_: deze kolom geeft aan of elke rij in de gegevensset al dan niet is gebruikt om beschrijvende statistieken te berekenen. 0 = Elke regel is gebruikt.
- _FREQ_: het aantal rijen dat wordt gebruikt om elke beschrijvende statistiek te berekenen.
- _STAT_: de naam van de beschrijvende statistiek.
- Gewicht: de numerieke waarde van de overeenkomstige beschrijvende statistiek.
Uit het resultaat kunnen we zien:
- Het totaal aantal waarnemingen bedroeg 158 .
- De minimale gewichtswaarde was 0 .
- De maximale gewichtswaarde was 1.650 .
- De gemiddelde gewichtswaarde was 398,70 .
- De standaardafwijking van de gewichtswaarden was 359,09 .
Uit deze vijf waarden kunnen we een redelijk goed inzicht krijgen in de verdeling van waarden voor de variabele Gewicht.
Voorbeeld 2: Processamenvatting met meerdere variabelen
Om beschrijvende statistieken voor meerdere variabelen tegelijk te berekenen, vermeldt u eenvoudigweg meerdere namen van variabelen in de var- instructie.
We kunnen bijvoorbeeld de volgende code gebruiken om beschrijvende statistieken voor de variabelen Gewicht en Lengte te berekenen:
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
Uit het resultaat kunnen we de vijf beschrijvende statistieken voor gewicht en lengte zien.
Voorbeeld 3: Samenvatting van het proces waarbij één variabele gegroepeerd is door een andere variabele
Om beschrijvende statistieken te berekenen voor een variabele gegroepeerd door een andere variabele, kunnen we de class- instructie gebruiken.
We kunnen bijvoorbeeld de volgende code gebruiken om beschrijvende statistieken te berekenen voor het gewicht gegroepeerd per soort:
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
De uitvoertabel toont beschrijvende statistieken voor elke vissoort.
Alleen al voor de brasemvis kunnen we bijvoorbeeld de volgende beschrijvende statistieken waarnemen:
- Het totaal aantal waarnemingen bedroeg 34 .
- De minimale gewichtswaarde was 242 .
- De maximale gewichtswaarde was 1000 .
- De gemiddelde gewichtswaarde was 626 .
- De standaardafwijking van de gewichtswaarden was 206,60 .
We kunnen deze beschrijvende statistieken ook voor alle andere soorten waarnemen.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Proc Append gebruiken in SAS
Proc-tabel gebruiken in SAS
Hoe de correlatie in SAS te berekenen
Hoe frequentietabellen in SAS te maken