SAS : Comment diviser des chaînes par délimiteur
Vous pouvez utiliser la fonction scan() dans SAS pour diviser rapidement une chaîne en fonction d’un délimiteur particulier.
L’exemple suivant montre comment utiliser cette fonction dans la pratique.
Exemple : diviser les chaînes par délimiteur dans SAS
Supposons que nous ayons l’ensemble de données suivant dans SAS :
/*create dataset*/ data my_data1; input name $25.; datalines; Andy_Lincoln_Bernard Barry_Michael Chad_Simpson_Smith Derrick_Parson_Henry Eric_Miller Frank_Giovanni_Goodwill ; run; /*print dataset*/ proc print data=my_data1;
Nous pouvons utiliser le code suivant pour diviser rapidement la chaîne de nom en trois chaînes distinctes :
/*create second dataset with name split into three columns*/ data my_data2; set my_data1; name1=scan(name, 1, '_'); name2=scan(name, 2, '_'); name3=scan(name, 3, '_'); run; /*view second dataset*/ proc print data=my_data2;
Notez que la chaîne de la colonne nom a été divisée en trois nouvelles colonnes.
Pour les noms pour lesquels il n’y a qu’un seul délimiteur, la valeur dans la colonne nom3 est simplement vide.
Notez que nous pourrions également utiliser la fonction drop pour supprimer la colonne de nom d’origine du nouvel ensemble de données :
/*create second dataset with name split into three columns, drop original name*/ data my_data2; set my_data1; name1=scan(name, 1, '_'); name2=scan(name, 2, '_'); name3=scan(name, 3, '_'); drop name; run; /*view second dataset*/ proc print data=my_data2;
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment normaliser les données dans SAS
Comment renommer des variables dans SAS
Comment supprimer les doublons dans SAS
Comment remplacer les valeurs manquantes par zéro dans SAS