Como extrair números de strings em r (com exemplos)


Você pode usar os seguintes métodos para extrair números de strings em R:

Método 1: extrair o número da string usando base R

 as. numeric (gsub(" \\D ", "", df$my_column))

Método 2: Extraia o número da string usando o pacote readr

 library (readr)

parse_number(df$my_column)

Este tutorial explica como usar cada método na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('Guard23', 'Guard14', '2Forward',
                            'Guard25', '6Forward', 'Center99'))

#view data frame
df

  team position
1A Guard23
2A Guard14
3 A 2Forward
4 B Guard25
5 B 6Forward
6 B Center99

Exemplo 1: Extraia o número de uma string usando base R

O código a seguir mostra como extrair os números de cada string na coluna de posição do quadro de dados:

 #extract number from each string in 'position' column
as. numeric (gsub(" \\D ", "", df$position))

[1] 23 14 2 25 6 99

Observe que os valores numéricos foram extraídos de cada string na coluna de posição .

Nota : A função gsub() simplesmente substitui todos os não-números ( \\D ) em uma string por espaço vazio. Isso tem o efeito de extrair apenas os números da string.

Se desejar, você também pode armazenar esses valores numéricos em uma nova coluna no quadro de dados:

 #create new column that contains numbers from each string in 'position' column
df$num <- as. numeric (gsub(" \\D ", "", df$position))

#view updated data frame
df

  team position number
1A Guard23 23
2A Guard14 14
3 A 2Forward 2
4 B Guard25 25
5 B 6Forward 6
6 B Center99 99

Exemplo 2: Extraia o número de uma string usando o pacote Reader

O código a seguir mostra como extrair os números de cada string na coluna de posição do quadro de dados usando a função parse_number() do pacote readr :

 library (readr)

#extract number from each string in 'position' column
parse_number(df$position)

[1] 23 14 2 25 6 99

Observe que os valores numéricos foram extraídos de cada string na coluna de posição .

Isso corresponde aos resultados do uso da função gsub() na base R.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como selecionar colunas contendo uma string específica em R
Como remover caracteres de uma string em R
Como encontrar a localização dos caracteres em uma string em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *