Como selecionar apenas colunas numéricas em r usando dplyr


Você pode usar a seguinte função do pacote dplyr para selecionar apenas as colunas numéricas de um quadro de dados em R:

 df %>% select(where(is. numeric ))

O exemplo a seguir mostra como usar esta função na prática.

Exemplo: selecione apenas colunas numéricas usando dplyr

Suponha que temos o seguinte quadro de dados em R que contém informações sobre vários jogadores de basquete:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 dots=c(22, 34, 30, 12, 18),
                 assists=c(7, 9, 9, 12, 14),
                 rebounds=c(5, 10, 10, 8, 8))

#view data frame
df

  team points assists rebounds
1 to 22 7 5
2 B 34 9 10
3 C 30 9 10
4 D 12 12 8
5 E 18 14 8

Podemos usar a seguinte sintaxe para selecionar apenas colunas numéricas do quadro de dados:

 library (dplyr)

#select only the numeric columns from the data frame
df %>% select(where(is. numeric ))

  points assists rebounds
1 22 7 5
2 34 9 10
3 30 9 10
4 12 12 8
5 18 14 8

Observe que apenas as três colunas numéricas foram selecionadas – pontos , assistências e rebotes .

Podemos verificar se essas colunas são numéricas usando a função str() para exibir o tipo de dados de cada variável no quadro de dados:

 #display data type of each variable in data frame
str(df)

'data.frame': 5 obs. of 4 variables:
 $ team: chr "A" "B" "C" "D" ...
 $ points: num 22 34 30 12 18
 $ assists: num 7 9 9 12 14
 $rebounds: num 5 10 10 8 8

Pelo resultado podemos ver que time é uma variável de caráter enquanto pontos , assistências e rebotes são todos numéricos.

Relacionado: Como verificar o tipo de dados em R (com exemplos)

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns usando dplyr:

Como selecionar colunas por nome usando dplyr
Como selecionar colunas por índice usando dplyr
Como usar select_if com múltiplas condições no dplyr

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *