Comment utiliser la fonction nchar() dans R



La fonction nchar() dans R peut être utilisée pour compter la longueur des caractères dans un objet chaîne.

Cette fonction utilise la syntaxe de base suivante :

nchar(x, garderNA = NA)

où:

  • x : Nom de l’objet chaîne
  • keepNA : La valeur par défaut est de renvoyer ‘NA’ si NA est rencontré. Si défini sur TRUE, une valeur de 2 est renvoyée pour représenter la longueur de « NA » sous forme de chaîne.

Les exemples suivants montrent comment utiliser cette fonction dans la pratique.

Exemple 1 : utilisez nchar() pour compter la longueur des caractères

Supposons que nous ayons le bloc de données suivant dans R :

#create data frame
df <- data.frame(player=c('J Kidd', 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
                 points=c(22, 34, 30, 17))

#view data frame
df

          player points
1         J Kidd     22
2    Kobe Bryant     34
3 Paul A. Pierce     30
4     Steve Nash     17

Le code suivant montre comment utiliser la fonction nchar() pour compter la longueur de chaque chaîne dans la colonne du lecteur :

#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)

#view updated data frame
df

          player points player_length
1         J Kidd     22             6
2    Kobe Bryant     34            11
3 Paul A. Pierce     30            14
4     Steve Nash     17            10

La nouvelle colonne appelée player_length contient la longueur de chaque chaîne de la colonne player .

Notez que la fonction nchar() compte également les espaces et les caractères spéciaux.

Par exemple, dans le nom « Paul A. Pierce », la fonction nchar() compte les deux espaces et le point ainsi que toutes les lettres pour obtenir une longueur totale de 14.

Exemple 2 : utilisez nchar() avec des valeurs NA

Supposons que nous ayons le bloc de données suivant dans R :

#create data frame
df <- data.frame(player=c(NA, 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
                 points=c(22, 34, 30, 17))

#view data frame
df

          player points
1           <NA>     22
2    Kobe Bryant     34
3 Paul A. Pierce     30
4     Steve Nash     17

Si nous utilisons la fonction nchar() pour compter la longueur de chaque chaîne dans la colonne du lecteur , alors une valeur de NA sera renvoyée pour la première ligne par défaut :

#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)

#view updated data frame
df

          player points player_length
1           <NA>     22            NA
2    Kobe Bryant     34            11
3 Paul A. Pierce     30            14
4     Steve Nash     17            10

Cependant, si nous utilisons l’argument keepNA=FALSE alors une valeur de 2 sera renvoyée pour chaque chaîne égale à NA :

#create new column that counts length of characters in player column
df$player_length <- nchar(df$player, keepNA=FALSE)

#view updated data frame
df

          player points player_length
1           <NA>     22             2
2    Kobe Bryant     34            11
3 Paul A. Pierce     30            14
4     Steve Nash     17            10

Notez qu’une valeur de 2 est renvoyée pour le premier joueur puisque cela représente la longueur de « NA » sous forme de chaîne.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment supprimer le dernier caractère de la chaîne dans R
Comment utiliser la fonction de sous-chaîne dans R
Comment utiliser la fonction str_pad dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *