R: como usar drop_na para eliminar linhas com valores ausentes
Você pode usar a função drop_na() do pacote Tidyr em R para eliminar linhas com valores ausentes em um quadro de dados.
Existem três maneiras comuns de usar esse recurso:
Método 1: remover linhas com valores ausentes em qualquer coluna
df %>% drop_na()
Método 2: remover linhas com valores ausentes em uma coluna específica
df %>% drop_na(col1)
Método 3: remover linhas com valores ausentes em uma das várias colunas específicas
df %>% drop_na(c(col1, col2))
Os exemplos a seguir mostram como usar cada um desses métodos na prática com o seguinte quadro de dados:
#create data frame df <- data. frame (points=c(10, NA, 15, 15, 14, 16), assists=c(4, NA, 4, NA, 9, 3), rebounds=c(NA, 5, 10, 7, 7, NA)) #view data frame df points assists rebounds 1 10 4 NA 2 NA NA 5 3 15 4 10 4 15 NA 7 5 14 9 7 6 16 3 NA
Exemplo 1: Exclua linhas com valores ausentes em qualquer coluna
O código a seguir mostra como usar drop_na() para eliminar linhas com valores ausentes em qualquer coluna:
library (tidyr)
#drop rows with missing values in any column
df %>% drop_na()
points assists rebounds
1 15 4 10
2 14 9 7
As únicas linhas restantes são aquelas que não contêm valores ausentes em nenhuma coluna.
Exemplo 2: Remover linhas com valores ausentes em uma coluna específica
O código a seguir mostra como usar drop_na() para remover linhas com valores ausentes na coluna de rejeições :
library (tidyr)
#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)
points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7
As únicas linhas restantes são aquelas sem valores ausentes na coluna de rejeições .
Exemplo 3: Exclua linhas com valores ausentes em uma das várias colunas específicas
O código a seguir mostra como usar drop_na() para eliminar linhas com valores ausentes nas colunas de pontos ou assistências :
library (tidyr)
#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))
points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA
As únicas linhas restantes são aquelas sem valores faltantes nas colunas de pontos ou assistências .
Nota: você pode encontrar a documentação online completa para o método drop_na() aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como recuperar números de linha em R
Como adicionar linhas a um quadro de dados em R
Como aplicar uma função a cada linha do quadro de dados em R