Sas: filter rijen die een tekenreeks bevatten


U kunt de volgende methoden gebruiken om SAS-gegevenssets te filteren op rijen die bepaalde tekenreeksen bevatten:

Methode 1: Filter rijen die een specifieke tekenreeks bevatten

 /*filter rows where var1 contains "string1"*/
data specific_data;
    set original_data;
    where var1 contains ' string1 ';
run ;

Methode 2: Filter de rij die één string bevat uit meerdere

 /*filter rows where var1 contains "string1", "string2", or "string3"*/
data specific_data;
    set original_data;
    where var1 in (' string1 ', ' string2 ', ' string3 ');
run ;

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende gegevensset in SAS:

 /*create dataset*/
data nba_data;
    input team $points;
    datalines ;
Mavs 95
Spurs 99
Warriors 104
Rockets 98
Heat 95
Nets 90
Magic 99
Cavs 106
;
run ;

/*view dataset*/
proc print data =nba_data;

Methode 1: Filter rijen die een specifieke tekenreeks bevatten

De volgende code laat zien hoe u de gegevensset filtert op rijen die de tekenreeks ‚avs‘ bevatten in de teamkolom :

 /*filter rows where team contains the string 'avs'*/
data specific_data;
    set nba_data;
    where team contains ' avs ';
run ;

/*view resulting rows*/
proc print data = specific_data;

De enige twee weergegeven regels zijn waar de teamkolom ‚avs‘ in de naam heeft.

Methode 2: Filter rijen die een of meerdere tekenreeksen bevatten

De volgende code laat zien hoe u de gegevensset filtert op rijen die de tekenreeksen ‚Mavs‘, ‚Nets‘ of ‚Rockets‘ bevatten in de teamkolom :

 /*filter rows where team contains the string 'Mavs', 'Nets', or 'Rockets'*/
data specific_data;
    set nba_data;
    where team in (' Mavs ', ' Nets ', ' Rockets ');
run ;

/*view resulting rows*/
proc print data = specific_data;

De resulterende gegevensset geeft alleen rijen weer waarin de teamkolom een van de drie tekenreeksen bevat die we hebben opgegeven.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Gegevens normaliseren in SAS
Variabelen hernoemen in SAS
Hoe duplicaten in SAS te verwijderen
Hoe ontbrekende waarden te vervangen door nul in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert