R : Comment rechercher des colonnes avec toutes les valeurs manquantes
Vous pouvez utiliser les méthodes suivantes pour rechercher des colonnes dans un bloc de données dans R contenant toutes les valeurs manquantes :
Méthode 1 : utiliser Base R
#check if each column has all missing values all_miss <- apply(df, 2, function(x) all(is.na(x))) #display columns with all missing values names(all_miss[all_miss>0])
Méthode 2 : utiliser le package purrr
library(purrr) #display columns with all missing values df %>% keep(~all(is.na(.x))) %>% names
Les deux méthodes produisent le même résultat, mais l’approche purrr a tendance à être plus rapide pour les trames de données extrêmement volumineuses.
Les exemples suivants montrent comment utiliser chaque méthode avec le bloc de données suivant dans R :
#create data frame
df <- data.frame(points=c(21, 15, 10, 4, 4, 9, 12, 10),
assists=c(NA, NA, NA, NA, NA, NA, NA, NA),
rebounds=c(8, 12, 14, 10, 7, 9, 8, 5),
steals=c(NA, NA, NA, NA, NA, NA, NA, NA))
#view data frame
df
points assists rebounds steals
1 21 NA 8 NA
2 15 NA 12 NA
3 10 NA 14 NA
4 4 NA 10 NA
5 4 NA 7 NA
6 9 NA 9 NA
7 12 NA 8 NA
8 10 NA 5 NA
Exemple 1 : rechercher des colonnes avec toutes les valeurs manquantes à l’aide de Base R
Le code suivant montre comment rechercher les colonnes du bloc de données avec toutes les valeurs manquantes :
#check if each column has all missing values all_miss <- apply(df, 2, function(x) all(is.na(x))) #display columns with all missing values names(all_miss[all_miss>0]) [1] "assists" "steals"
À partir du résultat, nous pouvons voir que les colonnes d’aides et d’interceptions ont toutes des valeurs manquantes.
Exemple 2 : rechercher des colonnes avec toutes les valeurs manquantes à l’aide du package purrr
Le code suivant montre comment rechercher les colonnes du bloc de données avec toutes les valeurs manquantes à l’aide des fonctions du package purrr :
library(purrr) #display columns with all missing values df %>% keep(~all(is.na(.x))) %>% names [1] "assists" "steals"
À partir du résultat, nous pouvons voir que les colonnes d’aides et d’interceptions ont toutes des valeurs manquantes.
Cela correspond à la sortie de la méthode de base R.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes avec des valeurs manquantes dans R :
Comment imputer les valeurs manquantes dans R
Comment remplacer les NA par des chaînes dans R
Comment remplacer les NA par Zero dans dplyr