Comment utiliser la fonction nchar() dans R
La fonction nchar() dans R peut être utilisée pour compter la longueur des caractères dans un objet chaîne.
Cette fonction utilise la syntaxe de base suivante :
nchar(x, garderNA = NA)
où:
- x : Nom de l’objet chaîne
- keepNA : La valeur par défaut est de renvoyer ‘NA’ si NA est rencontré. Si défini sur TRUE, une valeur de 2 est renvoyée pour représenter la longueur de « NA » sous forme de chaîne.
Les exemples suivants montrent comment utiliser cette fonction dans la pratique.
Exemple 1 : utilisez nchar() pour compter la longueur des caractères
Supposons que nous ayons le bloc de données suivant dans R :
#create data frame
df <- data.frame(player=c('J Kidd', 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
points=c(22, 34, 30, 17))
#view data frame
df
player points
1 J Kidd 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4 Steve Nash 17
Le code suivant montre comment utiliser la fonction nchar() pour compter la longueur de chaque chaîne dans la colonne du lecteur :
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)
#view updated data frame
df
player points player_length
1 J Kidd 22 6
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
La nouvelle colonne appelée player_length contient la longueur de chaque chaîne de la colonne player .
Notez que la fonction nchar() compte également les espaces et les caractères spéciaux.
Par exemple, dans le nom « Paul A. Pierce », la fonction nchar() compte les deux espaces et le point ainsi que toutes les lettres pour obtenir une longueur totale de 14.
Exemple 2 : utilisez nchar() avec des valeurs NA
Supposons que nous ayons le bloc de données suivant dans R :
#create data frame
df <- data.frame(player=c(NA, 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
points=c(22, 34, 30, 17))
#view data frame
df
player points
1 <NA> 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4 Steve Nash 17
Si nous utilisons la fonction nchar() pour compter la longueur de chaque chaîne dans la colonne du lecteur , alors une valeur de NA sera renvoyée pour la première ligne par défaut :
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)
#view updated data frame
df
player points player_length
1 <NA> 22 NA
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
Cependant, si nous utilisons l’argument keepNA=FALSE alors une valeur de 2 sera renvoyée pour chaque chaîne égale à NA :
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player, keepNA=FALSE)
#view updated data frame
df
player points player_length
1 <NA> 22 2
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
Notez qu’une valeur de 2 est renvoyée pour le premier joueur puisque cela représente la longueur de « NA » sous forme de chaîne.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment supprimer le dernier caractère de la chaîne dans R
Comment utiliser la fonction de sous-chaîne dans R
Comment utiliser la fonction str_pad dans R