So verwenden sie die substr-funktion in sas (mit beispielen)


Sie können die SUBSTR- Funktion in SAS verwenden, um einen Teil einer Zeichenfolge zu extrahieren.

Diese Funktion verwendet die folgende grundlegende Syntax:

SUBSTR(Quelle, Position, N)

Gold:

  • Quelle : Der zu analysierende Kanal
  • Position : Die Startposition zum Lesen
  • N : Die Anzahl der zu lesenden Zeichen

Hier sind die vier häufigsten Möglichkeiten, diese Funktion zu nutzen:

Methode 1: Extrahieren Sie die ersten N Zeichen aus der Zeichenfolge

 data new_data;
    set original_data;
    first_four = substr (string_variable, 1 , 4 );
run ;

Methode 2: Extrahieren Sie Zeichen in einem bestimmten Positionsbereich aus einer Zeichenfolge

 data new_data;
    set original_data;
    two_through_five = substr (string_variable, 2 , 4 );
run ;

Methode 3: Extrahieren Sie die letzten N Zeichen aus der Zeichenfolge

 data new_data;
    set original_data;
    last_three = substr (string_variable, length (string_variable)- 2 , 3 );
run ;

Methode 4: Erstellen Sie eine neue Variable, wenn die Zeichenfolge Zeichen enthält

 data new_data;
    set original_data;
    if substr (string_variable, 1 , 4 ) = ' some_string ' then new_var = ' Yes ';
    else new_var = ' No ';
run ;

Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Datensatz in SAS verwendet wird:

 /*create dataset*/
data original_data;
    input team $1-10;
    datalines ;
Warriors
Wizards
Rockets
Celtics
Thunder
;
run ;

/*view dataset*/
proc print data = original_data; 

Beispiel 1: Extrahieren Sie die ersten N Zeichen aus einer Zeichenfolge

Der folgende Code zeigt, wie die ersten 4 Zeichen aus der Teamvariablen extrahiert werden:

 /*create new dataset*/
data new_data;
    set original_data;
    first_four = substr (team, 1 , 4 );
run ;

/*view new dataset*/
proc print data = new_data;

Beachten Sie, dass die Variable first_four die ersten vier Zeichen der Teamvariablen enthält.

Beispiel 2: Extrahieren Sie Zeichen in einem bestimmten Positionsbereich aus einer Zeichenfolge

Der folgende Code zeigt, wie Zeichen aus den Positionen 2 bis 5 der Teamvariablen extrahiert werden:

 /*create new dataset*/
data new_data;
    set original_data;
    two_through_five = substr (team, 2 , 4 );
run ;

/*view new dataset*/
proc print data = new_data;

Beispiel 3: Extrahieren Sie die letzten N Zeichen aus einer Zeichenfolge

Der folgende Code zeigt, wie die letzten drei Zeichen aus der Teamvariablen extrahiert werden:

 /*create new dataset*/
data new_data;
    set original_data;
    last_three = substr (team , length (team) -2,3 );
run ;

/*view new dataset*/
proc print data = new_data; 

Beispiel 4: Erstellen Sie eine neue Variable, wenn die Zeichenfolge Zeichen enthält

Der folgende Code zeigt, wie eine neue Variable namens W_Team erstellt wird, die „ Ja “ ergibt, wenn das erste Zeichen des Teamnamens „W“ ist, oder „ Nein “, wenn die ersten Zeichen kein „W“ sind.

 /*create new dataset*/
data new_data;
    set original_data;
    if substr (team, 1 , 1 ) = ' W ' then W_Team = ' Yes ';
else W_Team = ' No ';
run ;

/*view new dataset*/
proc print data = new_data; 

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So normalisieren Sie Daten in SAS
So ersetzen Sie Zeichen in einer Zeichenfolge in SAS
So ersetzen Sie fehlende Werte in SAS durch Null
So entfernen Sie Duplikate in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert