Comment utiliser la fonction INDEX dans SAS (avec exemples)



Vous pouvez utiliser la fonction INDEX dans SAS pour renvoyer la position de la première occurrence d’une chaîne dans une autre chaîne de caractères.

Cette fonction utilise la syntaxe de base suivante :

INDEX(source, extrait)

où:

  • source : La chaîne à analyser
  • extrait : La chaîne de caractères à rechercher dans la source

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : utilisation de la fonction INDEX dans SAS

Supposons que nous ayons l’ensemble de données suivant dans SAS qui contient une colonne de noms :

/*create dataset*/
data original_data;
    input name $25.;
    datalines;
Andy Lincoln Bernard
Barren Michael Smith
Chad Simpson Arnolds
Derrick Smith Henrys
Eric Millerton Smith
Frank Giovanni Goode
;
run;

/*view dataset*/
proc print data=original_data;

Nous pouvons utiliser la fonction INDEX pour rechercher la position de la première occurrence de la chaîne « Smith » dans chaque ligne :

/*find position of first occurrence of 'Smith' in name*/
data new_data;
    set original_data;
    first_smith = index(name, 'Smith');
run;

/*view results*/
proc print data=new_data;

La nouvelle colonne appelée first_smith affiche la position de la première occurrence de la chaîne ‘Smith’ dans la colonne name .

Si ‘Smith’ n’est pas trouvé du tout, la fonction INDEX renvoie simplement une valeur de 0 .

Il est important de noter que la fonction INDEX est sensible à la casse, donc si vous recherchez « smith » à la place, la fonction INDEX renverra 0 pour chaque chaîne :

/*find position of first occurrence of 'smith' in name*/
data new_data;
    set original_data;
    first_smith = index(name, 'smith');
run;

/*view results*/
proc print data=new_data;

Pour effectuer une recherche insensible à la casse, vous pouvez utiliser la fonction lowcase() pour d’abord convertir chaque chaîne en minuscules, puis rechercher « smith » comme suit :

/*find position of first occurrence of 'smith' in name*/
data new_data;
    set original_data;
    first_smith = index(lowcase(name), 'smith');
run;

/*view results*/
proc print data=new_data;

En convertissant d’abord chaque chaîne en minuscules, nous pouvons utiliser la fonction INDEX pour effectuer une recherche insensible à la casse.

Ressources additionnelles

Les didacticiels suivants expliquent comment utiliser d’autres fonctions courantes dans SAS :

Comment utiliser la fonction SUBSTR dans SAS
Comment utiliser la fonction COMPRESS dans SAS
Comment utiliser la fonction FIND dans SAS
Comment utiliser la fonction COALESCE dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *