So verwenden sie die substr-funktion in sas (mit beispielen)
Sie können die SUBSTR- Funktion in SAS verwenden, um einen Teil einer Zeichenfolge zu extrahieren.
Diese Funktion verwendet die folgende grundlegende Syntax:
SUBSTR(Quelle, Position, N)
Gold:
- Quelle : Der zu analysierende Kanal
- Position : Die Startposition zum Lesen
- N : Die Anzahl der zu lesenden Zeichen
Hier sind die vier häufigsten Möglichkeiten, diese Funktion zu nutzen:
Methode 1: Extrahieren Sie die ersten N Zeichen aus der Zeichenfolge
data new_data;
set original_data;
first_four = substr (string_variable, 1 , 4 );
run ;
Methode 2: Extrahieren Sie Zeichen in einem bestimmten Positionsbereich aus einer Zeichenfolge
data new_data;
set original_data;
two_through_five = substr (string_variable, 2 , 4 );
run ;
Methode 3: Extrahieren Sie die letzten N Zeichen aus der Zeichenfolge
data new_data;
set original_data;
last_three = substr (string_variable, length (string_variable)- 2 , 3 );
run ;
Methode 4: Erstellen Sie eine neue Variable, wenn die Zeichenfolge Zeichen enthält
data new_data;
set original_data;
if substr (string_variable, 1 , 4 ) = ' some_string ' then new_var = ' Yes ';
else new_var = ' No ';
run ;
Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Datensatz in SAS verwendet wird:
/*create dataset*/
data original_data;
input team $1-10;
datalines ;
Warriors
Wizards
Rockets
Celtics
Thunder
;
run ;
/*view dataset*/
proc print data = original_data;
Beispiel 1: Extrahieren Sie die ersten N Zeichen aus einer Zeichenfolge
Der folgende Code zeigt, wie die ersten 4 Zeichen aus der Teamvariablen extrahiert werden:
/*create new dataset*/
data new_data;
set original_data;
first_four = substr (team, 1 , 4 );
run ;
/*view new dataset*/
proc print data = new_data;
Beachten Sie, dass die Variable first_four die ersten vier Zeichen der Teamvariablen enthält.
Beispiel 2: Extrahieren Sie Zeichen in einem bestimmten Positionsbereich aus einer Zeichenfolge
Der folgende Code zeigt, wie Zeichen aus den Positionen 2 bis 5 der Teamvariablen extrahiert werden:
/*create new dataset*/
data new_data;
set original_data;
two_through_five = substr (team, 2 , 4 );
run ;
/*view new dataset*/
proc print data = new_data;
Beispiel 3: Extrahieren Sie die letzten N Zeichen aus einer Zeichenfolge
Der folgende Code zeigt, wie die letzten drei Zeichen aus der Teamvariablen extrahiert werden:
/*create new dataset*/
data new_data;
set original_data;
last_three = substr (team , length (team) -2,3 );
run ;
/*view new dataset*/
proc print data = new_data;
Beispiel 4: Erstellen Sie eine neue Variable, wenn die Zeichenfolge Zeichen enthält
Der folgende Code zeigt, wie eine neue Variable namens W_Team erstellt wird, die „ Ja “ ergibt, wenn das erste Zeichen des Teamnamens „W“ ist, oder „ Nein “, wenn die ersten Zeichen kein „W“ sind.
/*create new dataset*/
data new_data;
set original_data;
if substr (team, 1 , 1 ) = ' W ' then W_Team = ' Yes ';
else W_Team = ' No ';
run ;
/*view new dataset*/
proc print data = new_data;
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:
So normalisieren Sie Daten in SAS
So ersetzen Sie Zeichen in einer Zeichenfolge in SAS
So ersetzen Sie fehlende Werte in SAS durch Null
So entfernen Sie Duplikate in SAS