Percentielen berekenen in sas: met voorbeelden
Dit zijn de drie meest gebruikelijke manieren om percentielen voor een gegevensset in SAS te berekenen:
Methode 1: Bereken een specifieke percentielwaarde
/*calculate 70th percentile value for var1*/
proc univariate data =original_data;
var var1;
output out =percentile_data
pctlpts = 70
pctlpre = P_;
run ;
Methode 2: Bereken meerdere specifieke percentielwaarden
/*calculate 70th, 80th, and 90th percentile value for var1*/
proc univariate data =original_data;
var var1;
output out =percentile_data
pctlpts = 70 80 90
pctlpre = P_;
run ;
Methode 3: percentielen berekenen per groep
/*sort original data by var2*/
proc sort data = original_data;
by var2;
run ;
/*calculate percentiles for var1 grouped by var2*/
proc univariate data =original_data;
var var1;
by var2;
output out =percentile_data
pctlpts = 70, 80, 90
pctlpre = P_;
run ;
Opmerking : De pctlpts- instructie specificeert de percentielen die moeten worden berekend, en de pctlpre- instructie specificeert het voorvoegsel dat moet worden gebruikt voor de percentielen in de uitvoer.
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende gegevensset in SAS:
/*create dataset*/
data original_data;
input team $points;
datalines ;
AT 12
At 15
At 16
At 21
At 22
At 25
At 29
At 31
B16
B22
B25
B29
B 30
B 31
B 33
B 38
;
run ;
/*view dataset*/
proc print data = original_data;
Voorbeeld 1: Bereken een specifieke percentielwaarde
De volgende code laat zien hoe u het 70e percentiel voor de puntenvariabele berekent:
/*calculate 70th percentile value for points*/
proc univariate data =original_data;
var points;
output out =percentile_data
pctlpts = 70
pctlpre = P_;
run ;
/*view results*/
proc print data =percentile_data;
De waarde op het 70e percentiel blijkt 30 te zijn.
Voorbeeld 2: Bereken meerdere specifieke percentielwaarden
De volgende code laat zien hoe u de 70e, 80e en 90e percentielwaarden voor de puntenvariabele berekent:
/*calculate 70th, 80th, and 90th percentile value for points*/
proc univariate data =original_data;
var points;
output out =percentile_data
pctlpts = 70 80 90
pctlpre = P_;
run ;
Zo interpreteert u het resultaat:
- De waarde op het 70e percentiel is 30 .
- De waarde op het 80e percentiel is 31 .
- De 90e percentielwaarde is 33 .
Voorbeeld 3: percentielen berekenen per groep
De volgende code laat zien hoe u de waarden op het 70e, 80e, 90e en 95e percentiel voor de puntenvariabele kunt berekenen, gegroepeerd op de teamvariabele :
/*sort original data by team*/
proc sort data = original_data;
by team;
run ;
/*calculate percentiles for points grouped by team*/
proc univariate data =original_data;
var points;
by team;
output out =percentile_data
pctlpts = 70 , 80 , 90 95
pctlpre = P_;
run ;
De uitvoertabel toont de 70e, 80e, 90e en 95e percentielwaarden voor de puntenvariabele voor teams A en B.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Procedureoverzicht gebruiken in SAS
Hoe frequentietabellen in SAS te maken
Hoe de correlatie in SAS te berekenen