R : Comment rechercher des colonnes avec toutes les valeurs manquantes



Vous pouvez utiliser les méthodes suivantes pour rechercher des colonnes dans un bloc de données dans R contenant toutes les valeurs manquantes :

Méthode 1 : utiliser Base R

#check if each column has all missing values
all_miss <- apply(df, 2, function(x) all(is.na(x)))

#display columns with all missing values
names(all_miss[all_miss>0])   

Méthode 2 : utiliser le package purrr

library(purrr)

#display columns with all missing values
df %>% keep(~all(is.na(.x))) %>% names

Les deux méthodes produisent le même résultat, mais l’approche purrr a tendance à être plus rapide pour les trames de données extrêmement volumineuses.

Les exemples suivants montrent comment utiliser chaque méthode avec le bloc de données suivant dans R :

#create data frame
df <- data.frame(points=c(21, 15, 10, 4, 4, 9, 12, 10),
                 assists=c(NA, NA, NA, NA, NA, NA, NA, NA),
                 rebounds=c(8, 12, 14, 10, 7, 9, 8, 5),
                 steals=c(NA, NA, NA, NA, NA, NA, NA, NA))

#view data frame
df

  points assists rebounds steals
1     21      NA        8     NA
2     15      NA       12     NA
3     10      NA       14     NA
4      4      NA       10     NA
5      4      NA        7     NA
6      9      NA        9     NA
7     12      NA        8     NA
8     10      NA        5     NA

Exemple 1 : rechercher des colonnes avec toutes les valeurs manquantes à l’aide de Base R

Le code suivant montre comment rechercher les colonnes du bloc de données avec toutes les valeurs manquantes :

#check if each column has all missing values
all_miss <- apply(df, 2, function(x) all(is.na(x)))

#display columns with all missing values
names(all_miss[all_miss>0])   

[1] "assists" "steals" 

À partir du résultat, nous pouvons voir que les colonnes d’aides et d’interceptions ont toutes des valeurs manquantes.

Exemple 2 : rechercher des colonnes avec toutes les valeurs manquantes à l’aide du package purrr

Le code suivant montre comment rechercher les colonnes du bloc de données avec toutes les valeurs manquantes à l’aide des fonctions du package purrr :

library(purrr)

#display columns with all missing values
df %>% keep(~all(is.na(.x))) %>% names

[1] "assists" "steals" 

À partir du résultat, nous pouvons voir que les colonnes d’aides et d’interceptions ont toutes des valeurs manquantes.

Cela correspond à la sortie de la méthode de base R.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes avec des valeurs manquantes dans R :

Comment imputer les valeurs manquantes dans R
Comment remplacer les NA par des chaînes dans R
Comment remplacer les NA par Zero dans dplyr

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *