Como remover colunas com valores na em r


Você pode usar um dos dois métodos para remover colunas de um quadro de dados em R que contém valores NA:

Método 1: Use Base R

 df[, colSums(is. na (df))== 0 ]

Método 2: use dplyr

 library (dplyr)

df %>% select_if(~ !any(is. na (.)))

Ambos os métodos produzem o mesmo resultado.

Os exemplos a seguir mostram como usar cada método na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, NA, NA, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B NA 28 28
3 C NA 31 24
4 D 88 39 24
5 E 95 34 NA

Exemplo 1: Remover Colunas com Valores NA Usando Base R

O código a seguir mostra como excluir colunas com valores NA usando funções R básicas:

 #define new data frame
new_df <- df[ , colSums(is. na (df))== 0 ]

#view new data frame
new_df

  team assists
1 to 33
2 B 28
3 C 31
4 D 39
5 E 34

Observe que as duas colunas com os valores NA (pontos e rebotes) foram removidas do quadro de dados.

Exemplo 2: Remova colunas com valores NA usando dplyr

O código a seguir mostra como remover colunas com valores NA usando funções do pacote dplyr :

 library (dplyr)

#define new data frame
new_df <- df %>% select_if(~ !any(is. na (.)))

#view new data frame
new_df

  team assists
1 to 33
2 B 28
3 C 31
4 D 39
5 E 34

Novamente, as duas colunas com os valores NA (pontos e rebotes) foram removidas do quadro de dados.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como adicionar uma coluna a um quadro de dados em R
Como renomear colunas de quadro de dados em R
Como classificar um quadro de dados por coluna em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *