Як використовувати функцію substring у r (4 приклади)


Функцію substring() у R можна використати для виділення підрядка у вектор символів.

Ця функція використовує такий синтаксис:

 substring(text, first, last)

золото:

  • текст: назва символьного вектора
  • first: перший елемент для вилучення
  • last: останній елемент для вилучення

Також зауважте, що функція substr() робить те саме, але з дещо іншими назвами аргументів:

 substr(text, first, last)

золото:

  • x: Ім’я вектора символів
  • початок: перший елемент для вилучення
  • stop: останній елемент для вилучення

Приклади в цьому посібнику показують, як використовувати функцію substring() на практиці з наступним кадром даних у R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Приклад 1: Вилучення символів між певними позиціями

У наступному коді показано, як використовувати функцію substring() для вилучення символів між позиціями 2 і 5 стовпця “team”:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Зауважте, що новий стовпець містить символи між позиціями 2 і 5 стовпця «команда».

Приклад 2: витягти перші N символів

У наведеному нижче коді показано, як за допомогою функції substring() отримати перші 3 символи зі стовпця «team»:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Зверніть увагу, що новий стовпець містить перші три символи стовпця “команда”.

Приклад 3: вилучення останніх N символів

У наведеному нижче коді показано, як за допомогою функції substring() отримати останні 3 символи зі стовпця «team»:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Зверніть увагу, що новий стовпець містить останні три символи стовпця “команда”.

Приклад 4: Заміна підрядка

У наступному коді показано, як використовувати функцію substring() , щоб замінити перші 3 символи значень у стовпці “team” на 3 зірочки:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Зауважте, що перші три символи назви кожної команди замінено зірочками.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції з рядками в R:

Як використовувати str_replace у R
Як виконати часткове зіставлення рядків у R
Як перетворити рядки на дати в R
Як перетворити символ на число в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *