Come contare i valori non na in r (3 esempi)


È possibile utilizzare i seguenti metodi per contare i valori non NA in R:

Metodo 1: conta i valori non NA nell’intero frame di dati

 sum( ! is. na (df))

Metodo 2: conta i valori non NA in ciascuna colonna del frame di dati

 colSums( ! is. na (df))

Metodo 3: contare i valori non NA per gruppo nel frame di dati

 library (dplyr)

df %>%
  group_by(var1) %>%
  summarise(total_non_na = sum( ! is. na (var2)))

L’esempio seguente mostra come utilizzare nella pratica ciascuno di questi metodi con il seguente frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, NA, 30, 32, 20, 22, 17, NA),
                 rebounds=c(10, 8, 9, 13, NA, 20, 8, 7))

#view data frame
df

  team points rebounds
1 to 12 10
2 A NA 8
3 to 30 9
4 A 32 13
5 B 20 NA
6 B 22 20
7 B 17 8
8 B NA 7

Metodo 1: conta i valori non NA nell’intero frame di dati

Il codice seguente mostra come contare il totale dei valori non NA nell’intero frame di dati:

 #count non-NA values in entire data frame
sum( ! is. na (df))

[1] 21

Dal risultato possiamo vedere che ci sono 21 valori non NA nell’intero frame di dati.

Metodo 2: conta i valori non NA in ciascuna colonna del frame di dati

Il codice seguente mostra come contare il totale dei valori non NA in ciascuna colonna del frame di dati:

 #count non-NA values in each column
colSums( ! is. na (df))

    team points rebounds 
       8 6 7

Dal risultato possiamo vedere:

  • Ci sono 8 valori non NA nella colonna della squadra.
  • Ci sono 6 valori non NA nella colonna dei punti.
  • Ci sono 7 valori non NA nella colonna dei rimbalzi.

Metodo 3: contare i valori non NA per gruppo

Il codice seguente mostra come contare i valori totali non NA nella colonna dei punti , raggruppati per colonna della squadra :

 library (dplyr)
df %>%
  group_by(team) %>%
  summarise(total_non_na = sum( ! is. na (points)))

# A tibble: 2 x 2
  team total_non_na
          
1 to 3
2 B 3

Dal risultato possiamo vedere:

  • Ci sono 3 valori non NA nella colonna dei punti per la Squadra A.
  • Ci sono 3 valori non NA nella colonna dei punti per la Squadra B.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni con valori mancanti in R:

Come trovare e contare i valori mancanti in R
Come imputare tutti i valori mancanti in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *