Gegevens subsetten in sas (3 voorbeelden)


Hier volgen de drie meest voorkomende manieren om een gegevensset in SAS onder te verdelen:

Methode 1: Kies welke kolommen u wilt behouden

 data new_data;
    set original_data;
    keep var1 var3;
run ;

Methode 2: Kies welke kolommen u wilt verwijderen

 data new_data;
    set original_data;
    dropvar4 ;
run ;

Methode 3: Kies welke rijen u wilt behouden op basis van de voorwaarde

 data new_data;
    set original_data;
    if var1 < 25 then delete;
run ;

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende gegevensset in SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;

/*view dataset*/
proc print data = original_data; 

Voorbeeld 1: Kies welke kolommen u wilt behouden

De volgende code laat zien hoe u een gegevensset kunt subsetten met behulp van de KEEP- instructie om alleen bepaalde kolommen te behouden:

 /*create new dataset*/
data new_data;
    set original_data;
    keep team points;
run ;

/*view new dataset*/
proc print data = new_data;

Voorbeeld 2: Kies de kolommen die u wilt verwijderen

De volgende code laat zien hoe u een gegevensset kunt subsetten met behulp van de DROP- instructie om specifieke kolommen te verwijderen:

 /*create new dataset*/
data new_data;
    set original_data;
    drop points;
run ;

/*view new dataset*/
proc print data = new_data;

Voorbeeld 3: Kies welke rijen u wilt behouden op basis van de voorwaarde

De volgende code laat zien hoe u een gegevensset kunt subsetten met behulp van de DELETE- instructie om specifieke rijen uit de gegevensset te verwijderen waarvan de waarde in de puntkolom kleiner is dan 25:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 then delete;
run ;

/*view new dataset*/
proc print data = new_data;

U kunt ook de OR| gebruiken ” om lijnen te verwijderen waar de punten minder dan 25 zijn of de rebounds minder dan 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 | rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

U kunt ook de operator AND& “ gebruiken om lijnen te verwijderen waarbij de punten minder dan 25 zijn en de bounces minder dan 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 & rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Variabelen hernoemen in SAS
Nieuwe variabelen maken in SAS
Hoe tekens in een string in SAS te vervangen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert