A: come trovare colonne con tutti i valori mancanti


È possibile utilizzare i seguenti metodi per trovare colonne in un frame di dati in R che contengono tutti i valori mancanti:

Metodo 1: utilizzare Base R

 #check if each column has all missing values
all_miss <- apply(df, 2, function (x) all(is. na (x)))

#display columns with all missing values
names(all_miss[all_miss>0])   

Metodo 2: utilizzare il pacchetto purrr

 library (purrr)

#display columns with all missing values
df %>% keep(~all(is. na (.x))) %>% names

Entrambi i metodi producono lo stesso risultato, ma l’approccio purrr tende ad essere più veloce per frame di dati estremamente grandi.

Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente frame di dati in R:

 #create data frame
df <- data. frame (points=c(21, 15, 10, 4, 4, 9, 12, 10),
                 assists=c(NA, NA, NA, NA, NA, NA, NA, NA),
                 rebounds=c(8, 12, 14, 10, 7, 9, 8, 5),
                 steals=c(NA, NA, NA, NA, NA, NA, NA, NA))

#view data frame
df

  points assists rebounds steals
1 21 NA 8 NA
2 15 NA 12 NA
3 10 NA 14 NA
4 4 NA 10 NA
5 4 NA 7 NA
6 9 NA 9 NA
7 12 NA 8 NA
8 10 NA 5 NA

Esempio 1: trova le colonne con tutti i valori mancanti utilizzando Base R

Il codice seguente mostra come trovare le colonne nel frame di dati con tutti i valori mancanti:

 #check if each column has all missing values
all_miss <- apply(df, 2, function (x) all(is. na (x)))

#display columns with all missing values
names(all_miss[all_miss>0])   

[1] “assists” “steals” 

Dal risultato, possiamo vedere che le colonne degli assist e delle intercettazioni hanno tutte valori mancanti.

Esempio 2: trova le colonne con tutti i valori mancanti utilizzando il pacchetto purrr

Il codice seguente mostra come trovare le colonne nel frame di dati con tutti i valori mancanti utilizzando le funzioni del pacchetto purrr :

 library (purrr)

#display columns with all missing values
df %>% keep(~all(is. na (.x))) %>% names

[1] “assists” “steals” 

Dal risultato, possiamo vedere che le colonne degli assist e delle intercettazioni hanno tutte valori mancanti.

Ciò corrisponde all’output del metodo base R.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni con valori mancanti in R:

Come imputare tutti i valori mancanti in R
Come sostituire i NA con stringhe in R
Come sostituire NA con Zero in dplyr

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *