Як використовувати функцію substring у r (4 приклади)
Функцію substring() у R можна використати для виділення підрядка у вектор символів.
Ця функція використовує такий синтаксис:
substring(text, first, last)
золото:
- текст: назва символьного вектора
- first: перший елемент для вилучення
- last: останній елемент для вилучення
Також зауважте, що функція substr() робить те саме, але з дещо іншими назвами аргументів:
substr(text, first, last)
золото:
- x: Ім’я вектора символів
- початок: перший елемент для вилучення
- stop: останній елемент для вилучення
Приклади в цьому посібнику показують, як використовувати функцію substring() на практиці з наступним кадром даних у R:
#create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))
#view data frame
df
team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies
Приклад 1: Вилучення символів між певними позиціями
У наступному коді показано, як використовувати функцію substring() для вилучення символів між позиціями 2 і 5 стовпця “team”:
#create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )
#view updated data frame
df
team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies
Зауважте, що новий стовпець містить символи між позиціями 2 і 5 стовпця «команда».
Приклад 2: витягти перші N символів
У наведеному нижче коді показано, як за допомогою функції substring() отримати перші 3 символи зі стовпця «team»:
#create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )
#view updated data frame
df
team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray
Зверніть увагу, що новий стовпець містить перші три символи стовпця “команда”.
Приклад 3: вилучення останніх N символів
У наведеному нижче коді показано, як за допомогою функції substring() отримати останні 3 символи зі стовпця «team»:
#create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))
#view updated data frame
df
team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies
Зверніть увагу, що новий стовпець містить останні три символи стовпця “команда”.
Приклад 4: Заміна підрядка
У наступному коді показано, як використовувати функцію substring() , щоб замінити перші 3 символи значень у стовпці “team” на 3 зірочки:
#replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "
#view updated data frame
df
team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies
Зауважте, що перші три символи назви кожної команди замінено зірочками.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції з рядками в R:
Як використовувати str_replace у R
Як виконати часткове зіставлення рядків у R
Як перетворити рядки на дати в R
Як перетворити символ на число в R