Sas: filter rijen die een tekenreeks bevatten
U kunt de volgende methoden gebruiken om SAS-gegevenssets te filteren op rijen die bepaalde tekenreeksen bevatten:
Methode 1: Filter rijen die een specifieke tekenreeks bevatten
/*filter rows where var1 contains "string1"*/
data specific_data;
set original_data;
where var1 contains ' string1 ';
run ;
Methode 2: Filter de rij die één string bevat uit meerdere
/*filter rows where var1 contains "string1", "string2", or "string3"*/
data specific_data;
set original_data;
where var1 in (' string1 ', ' string2 ', ' string3 ');
run ;
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende gegevensset in SAS:
/*create dataset*/
data nba_data;
input team $points;
datalines ;
Mavs 95
Spurs 99
Warriors 104
Rockets 98
Heat 95
Nets 90
Magic 99
Cavs 106
;
run ;
/*view dataset*/
proc print data =nba_data;
Methode 1: Filter rijen die een specifieke tekenreeks bevatten
De volgende code laat zien hoe u de gegevensset filtert op rijen die de tekenreeks ‚avs‘ bevatten in de teamkolom :
/*filter rows where team contains the string 'avs'*/ data specific_data; set nba_data; where team contains ' avs '; run ; /*view resulting rows*/ proc print data = specific_data;
De enige twee weergegeven regels zijn waar de teamkolom ‚avs‘ in de naam heeft.
Methode 2: Filter rijen die een of meerdere tekenreeksen bevatten
De volgende code laat zien hoe u de gegevensset filtert op rijen die de tekenreeksen ‚Mavs‘, ‚Nets‘ of ‚Rockets‘ bevatten in de teamkolom :
/*filter rows where team contains the string 'Mavs', 'Nets', or 'Rockets'*/ data specific_data; set nba_data; where team in (' Mavs ', ' Nets ', ' Rockets '); run ; /*view resulting rows*/ proc print data = specific_data;
De resulterende gegevensset geeft alleen rijen weer waarin de teamkolom een van de drie tekenreeksen bevat die we hebben opgegeven.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Gegevens normaliseren in SAS
Variabelen hernoemen in SAS
Hoe duplicaten in SAS te verwijderen
Hoe ontbrekende waarden te vervangen door nul in SAS