Comment supprimer des lignes avec NA dans une colonne spécifique dans R
Vous pouvez utiliser l’une des trois méthodes suivantes pour supprimer les lignes avec NA dans une colonne spécifique d’un bloc de données dans R :
#use is.na() method df[!is.na(df$col_name),] #use subset() method subset(df, !is.na(col_name)) #use tidyr method library(tidyr) df %>% drop_na(col_name)
Notez que chacune de ces méthodes produira les mêmes résultats.
Les exemples suivants montrent comment utiliser chacune de ces méthodes en pratique avec le bloc de données suivant :
#create data frame df <- data.frame(a = c(NA, 14, 19, 22, 26), b = c(14, NA, 9, NA, 5), c = c(45, 56, 54, 57, 59)) #view data frame df a b c 1 NA 14 45 2 14 NA 56 3 19 9 54 4 22 NA 57 5 26 5 59
Méthode 1 : supprimer les lignes avec NA à l’aide de is.na()
Le code suivant montre comment supprimer des lignes du bloc de données avec des valeurs NA dans une certaine colonne à l’aide de la méthode is.na() :
#remove rows from data frame with NA values in column 'b' df[!is.na(df$b),] a b c 1 NA 14 45 3 19 9 54 5 26 5 59
Méthode 2 : supprimer les lignes avec NA à l’aide de subset()
Le code suivant montre comment supprimer des lignes du bloc de données avec des valeurs NA dans une certaine colonne à l’aide de la méthode subset() :
#remove rows from data frame with NA values in column 'b' subset(df, !is.na(b)) a b c 1 NA 14 45 3 19 9 54 5 26 5 59
Méthode 3 : supprimer les lignes avec NA à l’aide de drop_na()
Le code suivant montre comment supprimer des lignes du bloc de données avec des valeurs NA dans une certaine colonne à l’aide de la méthode drop_na() :
library(tidyr)
#remove rows from data frame with NA values in column 'b'
df %>% drop_na(b)
a b c
1 NA 14 45
3 19 9 54
5 26 5 59
Notez que chacune des trois méthodes a produit le même résultat.
Remarque : Vous pouvez trouver la documentation en ligne complète de la méthode drop_na() ici .
Ressources additionnelles
Comment appliquer une fonction à chaque ligne du bloc de données dans R
Comment récupérer les numéros de ligne dans R
Comment ajouter des lignes à un bloc de données dans R