Como contar valores não-na em r (3 exemplos)


Você pode usar os seguintes métodos para contar valores não-NA em R:

Método 1: contar valores não-NA em todo o quadro de dados

 sum( ! is. na (df))

Método 2: contar valores não-NA em cada coluna do quadro de dados

 colSums( ! is. na (df))

Método 3: contar valores não-NA por grupo no quadro de dados

 library (dplyr)

df %>%
  group_by(var1) %>%
  summarise(total_non_na = sum( ! is. na (var2)))

O exemplo a seguir mostra como usar cada um desses métodos na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, NA, 30, 32, 20, 22, 17, NA),
                 rebounds=c(10, 8, 9, 13, NA, 20, 8, 7))

#view data frame
df

  team points rebounds
1 to 12 10
2 A NA 8
3 to 30 9
4 A 32 13
5 B 20 NA
6 B 22 20
7 B 17 8
8 B NA 7

Método 1: contar valores não-NA em todo o quadro de dados

O código a seguir mostra como contar o total de valores não-NA em todo o quadro de dados:

 #count non-NA values in entire data frame
sum( ! is. na (df))

[1] 21

A partir do resultado, podemos ver que existem 21 valores não-NA em todo o quadro de dados.

Método 2: contar valores não-NA em cada coluna do quadro de dados

O código a seguir mostra como contar o total de valores não-NA em cada coluna do quadro de dados:

 #count non-NA values in each column
colSums( ! is. na (df))

    team points rebounds 
       8 6 7

Pelo resultado podemos ver:

  • Existem 8 valores não-NA na coluna da equipe.
  • Existem 6 valores não-NA na coluna de pontos.
  • Existem 7 valores não-NA na coluna de rejeições.

Método 3: contar valores não-NA por grupo

O código a seguir mostra como contar o total de valores não-NA na coluna de pontos , agrupados pela coluna da equipe :

 library (dplyr)
df %>%
  group_by(team) %>%
  summarise(total_non_na = sum( ! is. na (points)))

# A tibble: 2 x 2
  team total_non_na
          
1 to 3
2 B 3

Pelo resultado podemos ver:

  • Existem 3 valores não-NA na coluna de pontos para o Time A.
  • Existem 3 valores não-NA na coluna de pontos para o Time B.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns com valores ausentes em R:

Como encontrar e contar valores ausentes em R
Como imputar todos os valores ausentes em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *