Sas: filtra le righe contenenti una stringa


È possibile utilizzare i seguenti metodi per filtrare i set di dati SAS per le righe contenenti determinate stringhe:

Metodo 1: filtra le righe contenenti una stringa specifica

 /*filter rows where var1 contains "string1"*/
data specific_data;
    set original_data;
    where var1 contains ' string1 ';
run ;

Metodo 2: filtra la riga contenente una stringa tra diverse

 /*filter rows where var1 contains "string1", "string2", or "string3"*/
data specific_data;
    set original_data;
    where var1 in (' string1 ', ' string2 ', ' string3 ');
run ;

Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente set di dati in SAS:

 /*create dataset*/
data nba_data;
    input team $points;
    datalines ;
Mavs 95
Spurs 99
Warriors 104
Rockets 98
Heat 95
Nets 90
Magic 99
Cavs 106
;
run ;

/*view dataset*/
proc print data =nba_data;

Metodo 1: filtra le righe contenenti una stringa specifica

Il codice seguente mostra come filtrare il set di dati per le righe contenenti la stringa “avs” nella colonna del team :

 /*filter rows where team contains the string 'avs'*/
data specific_data;
    set nba_data;
    where team contains ' avs ';
run ;

/*view resulting rows*/
proc print data = specific_data;

Le uniche due righe mostrate sono quelle in cui la colonna della squadra contiene “avs” nel nome.

Metodo 2: filtrare le righe contenenti una delle numerose stringhe

Il codice seguente mostra come filtrare il set di dati per le righe contenenti le stringhe “Mavs”, “Nets” o “Rockets” nella colonna della squadra :

 /*filter rows where team contains the string 'Mavs', 'Nets', or 'Rockets'*/
data specific_data;
    set nba_data;
    where team in (' Mavs ', ' Nets ', ' Rockets ');
run ;

/*view resulting rows*/
proc print data = specific_data;

Il set di dati risultante mostra solo le righe in cui la colonna del team contiene una delle tre stringhe specificate.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come normalizzare i dati in SAS
Come rinominare le variabili in SAS
Come rimuovere i duplicati in SAS
Come sostituire i valori mancanti con zero in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *