SAS : Comment diviser des chaînes par délimiteur



Vous pouvez utiliser la fonction scan() dans SAS pour diviser rapidement une chaîne en fonction d’un délimiteur particulier.

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : diviser les chaînes par délimiteur dans SAS

Supposons que nous ayons l’ensemble de données suivant dans SAS :

/*create dataset*/
data my_data1;
    input name $25.;
    datalines;
Andy_Lincoln_Bernard
Barry_Michael
Chad_Simpson_Smith
Derrick_Parson_Henry
Eric_Miller
Frank_Giovanni_Goodwill
;
run;

/*print dataset*/
proc print data=my_data1;

Nous pouvons utiliser le code suivant pour diviser rapidement la chaîne de nom en trois chaînes distinctes :

/*create second dataset with name split into three columns*/
data my_data2;
    set my_data1;
    name1=scan(name, 1, '_');
    name2=scan(name, 2, '_');
    name3=scan(name, 3, '_');
run;

/*view second dataset*/
proc print data=my_data2;

Notez que la chaîne de la colonne nom a été divisée en trois nouvelles colonnes.

Pour les noms pour lesquels il n’y a qu’un seul délimiteur, la valeur dans la colonne nom3 est simplement vide.

Notez que nous pourrions également utiliser la fonction drop pour supprimer la colonne de nom d’origine du nouvel ensemble de données :

/*create second dataset with name split into three columns, drop original name*/
data my_data2;
    set my_data1;
    name1=scan(name, 1, '_');
    name2=scan(name, 2, '_');
    name3=scan(name, 3, '_');
    drop name;
run;

/*view second dataset*/
proc print data=my_data2;

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment normaliser les données dans SAS
Comment renommer des variables dans SAS
Comment supprimer les doublons dans SAS
Comment remplacer les valeurs manquantes par zéro dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *