Como encontrar e contar valores ausentes em r (com exemplos)


Você pode usar os seguintes métodos para encontrar e contar valores ausentes em R:

Método 1: Encontre a localização dos valores ausentes

 which( is.na (df$column_name))

Método 2: contar o total de valores ausentes

 sum( is.na (df$column_name))

Os exemplos a seguir mostram como usar essas funções na prática.

Exemplo 1: Encontre e conte valores ausentes em uma coluna

Suponha que temos o seguinte quadro de dados:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

Podemos usar o código a seguir para identificar posições que possuem valores faltantes na coluna “assistência” e encontrar o total de valores faltantes na coluna “assistência”:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

Pelo resultado podemos ver que as posições 1 , 3 e 4 possuem valores faltantes na coluna ‘assistências’ e há um total de 3 valores faltantes na coluna.

Exemplo 2: conte os valores ausentes em todas as colunas

O código a seguir mostra como contar o total de valores ausentes em cada coluna de um quadro de dados:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

Pelo resultado podemos ver:

  • A coluna “equipe” possui 1 valor ausente.
  • A coluna “pontos” contém 0 valores ausentes.
  • A coluna “assistência” possui 3 valores ausentes.
  • A coluna “rebotes” tem 1 valor ausente.

Exemplo 3: conte os valores ausentes em todo o quadro de dados

O código a seguir mostra como contar o total de valores ausentes em um quadro de dados inteiro:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

A partir do resultado, podemos ver que existem 5 valores ausentes no total em todo o quadro de dados.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns com valores ausentes em R:

Como imputar todos os valores ausentes em R
Como substituir NAs por strings em R
Como substituir NA por Zero no dplyr

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *