Sas: filtra le righe contenenti una stringa
È possibile utilizzare i seguenti metodi per filtrare i set di dati SAS per le righe contenenti determinate stringhe:
Metodo 1: filtra le righe contenenti una stringa specifica
/*filter rows where var1 contains "string1"*/
data specific_data;
set original_data;
where var1 contains ' string1 ';
run ;
Metodo 2: filtra la riga contenente una stringa tra diverse
/*filter rows where var1 contains "string1", "string2", or "string3"*/
data specific_data;
set original_data;
where var1 in (' string1 ', ' string2 ', ' string3 ');
run ;
Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente set di dati in SAS:
/*create dataset*/
data nba_data;
input team $points;
datalines ;
Mavs 95
Spurs 99
Warriors 104
Rockets 98
Heat 95
Nets 90
Magic 99
Cavs 106
;
run ;
/*view dataset*/
proc print data =nba_data;
Metodo 1: filtra le righe contenenti una stringa specifica
Il codice seguente mostra come filtrare il set di dati per le righe contenenti la stringa “avs” nella colonna del team :
/*filter rows where team contains the string 'avs'*/ data specific_data; set nba_data; where team contains ' avs '; run ; /*view resulting rows*/ proc print data = specific_data;
Le uniche due righe mostrate sono quelle in cui la colonna della squadra contiene “avs” nel nome.
Metodo 2: filtrare le righe contenenti una delle numerose stringhe
Il codice seguente mostra come filtrare il set di dati per le righe contenenti le stringhe “Mavs”, “Nets” o “Rockets” nella colonna della squadra :
/*filter rows where team contains the string 'Mavs', 'Nets', or 'Rockets'*/ data specific_data; set nba_data; where team in (' Mavs ', ' Nets ', ' Rockets '); run ; /*view resulting rows*/ proc print data = specific_data;
Il set di dati risultante mostra solo le righe in cui la colonna del team contiene una delle tre stringhe specificate.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come normalizzare i dati in SAS
Come rinominare le variabili in SAS
Come rimuovere i duplicati in SAS
Come sostituire i valori mancanti con zero in SAS