Sas: proc sort gebruiken met de keep-instructie


U kunt PROC SORT gebruiken met de KEEP- instructie in SAS om rijen in een gegevensset te sorteren en na het sorteren alleen specifieke kolommen te behouden.

Om dit te doen, kunt u de volgende basissyntaxis gebruiken:

 proc sort data=my_data out =sorted_data ( keep =var1 var2);
    by var2;
run ;

In dit specifieke voorbeeld worden de rijen in de dataset gesorteerd op basis van de waarden in kolom var2 en worden na het sorteren alleen de kolommen var1 en var2 bewaard.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Gebruik PROC SORT met de KEEP-instructie in SAS

Stel dat we de volgende dataset in SAS hebben die informatie bevat over verschillende basketbalteams:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
Mavs 113 22
Pacers 95 19
Cavs 100 34
Lakers 114 20
Heat 123 39
Kings 100 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119 29
;
run ;

/*view dataset*/
proc print data =my_data; 

We zouden de volgende syntaxis kunnen gebruiken om de rijen van de dataset te sorteren op basis van de waarden in de puntenkolom :

 /*sort rows in dataset based on values in points column*/
proc sort data =my_data out =sorted_data;
    by points;
run ;

/*view sorted dataset*/
proc print data =sorted_data;

Merk op dat de rijen nu in oplopende volgorde worden gesorteerd op basis van de waarden in de puntenkolom .

Standaard behoudt SAS na het sorteren alle kolommen in de gegevensset.

U kunt echter de KEEP- instructie gebruiken om op te geven welke kolommen na het sorteren moeten worden behouden.

We kunnen bijvoorbeeld de volgende syntaxis gebruiken om de rijen in de dataset te sorteren op basis van de waarden in de puntenkolom , en vervolgens alleen de team- en puntenkolommen te behouden:

 /*sort rows in dataset based on values in points column and only keep team and points*/
proc sort data=my_data out =sorted_data ( keep =team points);
    by points;
run ;

/*view sorted dataset*/
proc print data =sorted_data; 

Opnieuw worden de rijen in oplopende volgorde gesorteerd op basis van de puntenkolomwaarden , maar deze keer hebben we de KEEP- instructie gebruikt om na het sorteren alleen de team- en puntenkolommen te behouden.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Hoe PROC SORT te gebruiken met NODUPKEY in SAS
Variabelen hernoemen in SAS
Nieuwe variabelen maken in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert