Come trovare e contare i valori mancanti in r (con esempi)


È possibile utilizzare i seguenti metodi per trovare e contare i valori mancanti in R:

Metodo 1: trovare la posizione dei valori mancanti

 which( is.na (df$column_name))

Metodo 2: contare i valori mancanti totali

 sum( is.na (df$column_name))

I seguenti esempi mostrano come utilizzare queste funzioni nella pratica.

Esempio 1: trova e conta i valori mancanti in una colonna

Supponiamo di avere il seguente frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

Possiamo utilizzare il seguente codice per identificare le posizioni che hanno valori mancanti nella colonna “assist” e trovare il totale dei valori mancanti nella colonna “assist”:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

Dal risultato possiamo vedere che le posizioni 1 , 3 e 4 hanno valori mancanti nella colonna “assist” e ci sono un totale di 3 valori mancanti nella colonna.

Esempio 2: conta i valori mancanti in tutte le colonne

Il codice seguente mostra come contare i valori mancanti totali in ciascuna colonna di un frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

Dal risultato possiamo vedere:

  • La colonna “squadra” ha 1 valore mancante.
  • La colonna “punti” contiene 0 valori mancanti.
  • La colonna “assistenza” ha 3 valori mancanti.
  • La colonna “rimbalzi” ha 1 valore mancante.

Esempio 3: contare i valori mancanti nell’intero frame di dati

Il codice seguente mostra come contare i valori mancanti totali in un intero frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

Dal risultato possiamo vedere che ci sono 5 valori mancanti in totale nell’intero frame di dati.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni con valori mancanti in R:

Come imputare tutti i valori mancanti in R
Come sostituire i NA con stringhe in R
Come sostituire NA con Zero in dplyr

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *