Как использовать функцию nchar() в r


Функцию nchar() в R можно использовать для подсчета длины символов в строковом объекте.

Эта функция использует следующий базовый синтаксис:

nchar(x, KeepNA = NA)

Золото:

  • x : Имя строкового объекта.
  • KeepNA : по умолчанию возвращается «NA», если встречается NA. Если установлено значение TRUE, возвращается значение 2, представляющее длину «NA» в виде строки.

Следующие примеры показывают, как использовать эту функцию на практике.

Пример 1. Используйте nchar() для подсчета длины символов.

Предположим, у нас есть следующий кадр данных в R:

 #create data frame
df <- data. frame (player=c('J Kidd', 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
                 dots=c(22, 34, 30, 17))

#view data frame
df

          player points
1 J Kidd 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17

Следующий код показывает, как использовать функцию nchar() для подсчета длины каждой строки в столбце чтения :

 #create new column that counts length of characters in player column
df$player_length <- nchar(df$player)

#view updated data frame
df

player points player_length
1 J Kidd 22 6
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10

Новый столбец player_length содержит длину каждой строки в столбце player .

Обратите внимание, что функция nchar() также учитывает пробелы и специальные символы.

Например, в имени «Пол А. Пирс» функция nchar() подсчитывает пробелы и точку, а также все буквы, чтобы получить общую длину 14.

Пример 2. Использование nchar() со значениями NA

Предположим, у нас есть следующий кадр данных в R:

 #create data frame
df <- data. frame (player=c(NA, 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
                 dots=c(22, 34, 30, 17))

#view data frame
df

          player points
1 <NA> 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17

Если мы используем функцию nchar() для подсчета длины каждой строки в столбце чтения , то для первой строки по умолчанию будет возвращено значение NA:

 #create new column that counts length of characters in player column
df$player_length <- nchar(df$player)

#view updated data frame
df

player points player_length
1 <NA> 22 NA
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10

Однако если мы используем аргумент KeepNA=FALSE, то для каждой строки, равной NA, будет возвращено значение 2 :

 #create new column that counts length of characters in player column
df$player_length <- nchar(df$player, keepNA= FALSE )

#view updated data frame
df

          player points player_length
1 <NA> 22 2
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10

Обратите внимание, что для первого игрока возвращается значение 2 , поскольку оно представляет длину «NA» в виде строки.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как удалить последний символ из строки в R
Как использовать функцию подстроки в R
Как использовать функцию str_pad в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *