Как использовать функцию nchar() в r
Функцию nchar() в R можно использовать для подсчета длины символов в строковом объекте.
Эта функция использует следующий базовый синтаксис:
nchar(x, KeepNA = NA)
Золото:
- x : Имя строкового объекта.
- KeepNA : по умолчанию возвращается «NA», если встречается NA. Если установлено значение TRUE, возвращается значение 2, представляющее длину «NA» в виде строки.
Следующие примеры показывают, как использовать эту функцию на практике.
Пример 1. Используйте nchar() для подсчета длины символов.
Предположим, у нас есть следующий кадр данных в R:
#create data frame
df <- data. frame (player=c('J Kidd', 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
dots=c(22, 34, 30, 17))
#view data frame
df
player points
1 J Kidd 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17
Следующий код показывает, как использовать функцию nchar() для подсчета длины каждой строки в столбце чтения :
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)
#view updated data frame
df
player points player_length
1 J Kidd 22 6
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
Новый столбец player_length содержит длину каждой строки в столбце player .
Обратите внимание, что функция nchar() также учитывает пробелы и специальные символы.
Например, в имени «Пол А. Пирс» функция nchar() подсчитывает пробелы и точку, а также все буквы, чтобы получить общую длину 14.
Пример 2. Использование nchar() со значениями NA
Предположим, у нас есть следующий кадр данных в R:
#create data frame
df <- data. frame (player=c(NA, 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
dots=c(22, 34, 30, 17))
#view data frame
df
player points
1 <NA> 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17
Если мы используем функцию nchar() для подсчета длины каждой строки в столбце чтения , то для первой строки по умолчанию будет возвращено значение NA:
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)
#view updated data frame
df
player points player_length
1 <NA> 22 NA
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
Однако если мы используем аргумент KeepNA=FALSE, то для каждой строки, равной NA, будет возвращено значение 2 :
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player, keepNA= FALSE )
#view updated data frame
df
player points player_length
1 <NA> 22 2
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
Обратите внимание, что для первого игрока возвращается значение 2 , поскольку оно представляет длину «NA» в виде строки.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как удалить последний символ из строки в R
Как использовать функцию подстроки в R
Как использовать функцию str_pad в R