Как извлечь числа из строк в r (с примерами)


Вы можете использовать следующие методы для извлечения чисел из строк в R:

Способ 1. Извлечение номера строки с использованием базы R.

 as. numeric (gsub(" \\D ", "", df$my_column))

Способ 2. Извлеките номер строки с помощью пакета readr.

 library (readr)

parse_number(df$my_column)

В этом руководстве объясняется, как использовать каждый метод на практике со следующим фреймом данных:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('Guard23', 'Guard14', '2Forward',
                            'Guard25', '6Forward', 'Center99'))

#view data frame
df

  team position
1A Guard23
2A Guard14
3 A 2Forward
4 B Guard25
5 B 6Forward
6 B Center99

Пример 1. Извлечение числа из строки по основанию R.

Следующий код показывает, как извлечь числа из каждой строки в столбце позиции фрейма данных:

 #extract number from each string in 'position' column
as. numeric (gsub(" \\D ", "", df$position))

[1] 23 14 2 25 6 99

Обратите внимание, что числовые значения были извлечены из каждой строки в столбце позиции .

Примечание . Функция gsub() просто заменяет все нечисловые значения ( \\D ) в строке пустым пространством. Это приводит к извлечению только чисел из строки.

При желании вы также можете сохранить эти числовые значения в новом столбце фрейма данных:

 #create new column that contains numbers from each string in 'position' column
df$num <- as. numeric (gsub(" \\D ", "", df$position))

#view updated data frame
df

  team position number
1A Guard23 23
2A Guard14 14
3 A 2Forward 2
4 B Guard25 25
5 B 6Forward 6
6 B Center99 99

Пример 2. Извлечение числа из строки с помощью пакета Reader

Следующий код показывает, как извлечь числа из каждой строки в столбце позиции фрейма данных с помощью функции parse_number() из пакета readr :

 library (readr)

#extract number from each string in 'position' column
parse_number(df$position)

[1] 23 14 2 25 6 99

Обратите внимание, что числовые значения были извлечены из каждой строки в столбце позиции .

Это соответствует результатам использования функции gsub() в базе R.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как выбрать столбцы, содержащие определенную строку в R
Как удалить символы из строки в R
Как найти местоположение символа в строке в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *