R: como usar drop_na para eliminar linhas com valores ausentes


Você pode usar a função drop_na() do pacote Tidyr em R para eliminar linhas com valores ausentes em um quadro de dados.

Existem três maneiras comuns de usar esse recurso:

Método 1: remover linhas com valores ausentes em qualquer coluna

 df %>% drop_na()

Método 2: remover linhas com valores ausentes em uma coluna específica

 df %>% drop_na(col1)

Método 3: remover linhas com valores ausentes em uma das várias colunas específicas

 df %>% drop_na(c(col1, col2))

Os exemplos a seguir mostram como usar cada um desses métodos na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

Exemplo 1: Exclua linhas com valores ausentes em qualquer coluna

O código a seguir mostra como usar drop_na() para eliminar linhas com valores ausentes em qualquer coluna:

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

As únicas linhas restantes são aquelas que não contêm valores ausentes em nenhuma coluna.

Exemplo 2: Remover linhas com valores ausentes em uma coluna específica

O código a seguir mostra como usar drop_na() para remover linhas com valores ausentes na coluna de rejeições :

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

As únicas linhas restantes são aquelas sem valores ausentes na coluna de rejeições .

Exemplo 3: Exclua linhas com valores ausentes em uma das várias colunas específicas

O código a seguir mostra como usar drop_na() para eliminar linhas com valores ausentes nas colunas de pontos ou assistências :

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

As únicas linhas restantes são aquelas sem valores faltantes nas colunas de pontos ou assistências .

Nota: você pode encontrar a documentação online completa para o método drop_na() aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como recuperar números de linha em R
Como adicionar linhas a um quadro de dados em R
Como aplicar uma função a cada linha do quadro de dados em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *