A: conte o número de valores na em cada coluna


Você pode usar os seguintes métodos para contar o número de valores NA em cada coluna de um quadro de dados em R:

Método 1: contar os valores de NA em cada coluna usando a base R

 sapply(df, function (x) sum(is. na (x)))

Método 2: contar os valores de NA em cada coluna usando dplyr

 library (dplyr)

df %>% summarise(across(everything(), ~ sum(is. na (.))))

Os exemplos a seguir mostram como usar cada método com o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, NA),
                 assists=c(33, NA, NA, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 90 NA 28
3 C 86 NA 24
4 D 88 39 24
5 E NA 34 28

Exemplo 1: Conte os valores de NA em cada coluna usando a base R

O código a seguir mostra como contar o número de valores NA em cada coluna usando a função R base sapply() :

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

Pelo resultado podemos ver:

  • A coluna da equipe tem 0 valores NA.
  • A coluna de pontos tem valor de 1 NA.
  • A coluna de assistências possui 2 valores NA.
  • A coluna de rejeições tem 0 valores NA.

Nota : A função sapply() pode ser usada para aplicar uma função a cada coluna do quadro de dados. Neste exemplo, aplicamos uma função que conta o número total de elementos igual a NA.

Exemplo 2: conte os valores de NA em cada coluna usando dplyr

O código a seguir mostra como contar o número de valores NA em cada coluna usando a função summarise() do pacote dplyr :

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

Pelo resultado podemos ver:

  • A coluna da equipe tem 0 valores NA.
  • A coluna de pontos tem valor de 1 NA.
  • A coluna de assistências possui 2 valores NA.
  • A coluna de rejeições tem 0 valores NA.

Estes resultados correspondem aos do exemplo anterior.

Nota : O método dplyr tende a ser mais rápido que o método R base ao trabalhar com quadros de dados extremamente grandes.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como usar na.omit em R
Como usar complete.cases em R
Como remover linhas em branco do quadro de dados em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *