Comment utiliser complete.cases dans R (avec exemples)
Vous pouvez utiliser la fonction complete.cases() dans R pour supprimer les valeurs manquantes dans un vecteur, une matrice ou un bloc de données.
Cette fonction utilise la syntaxe de base suivante :
#remove missing values from vector x <- x[complete.cases(x)] #remove rows with missing values in any column of data frame df <- df[complete.cases(df), ] #remove rows with NA in specific columns of data frame df <- df[complete.cases(df[ , c('col1', 'col2', ...)]), ]
Les exemples suivants montrent comment utiliser cette fonction dans la pratique.
Exemple 1 : Supprimer les valeurs manquantes du vecteur
Le code suivant montre comment supprimer toutes les valeurs NA d’un vecteur :
#define vector x <- c(1, 24, NA, 6, NA, 9) #remove NA values from vector x <- x[complete.cases(x)] x [1] 1 24 6 9
Exemple 2 : Supprimer les lignes avec NA dans n’importe quelle colonne du bloc de données
Le code suivant montre comment supprimer les lignes avec des valeurs NA dans n’importe quelle colonne d’un bloc de données :
#define data frame df <- data.frame(x=c(1, 24, NA, 6, NA, 9), y=c(NA, 3, 4, 8, NA, 12), z=c(NA, 7, 5, 15, 7, 14)) #view data frame df x y z 1 1 NA NA 2 24 3 7 3 NA 4 5 4 6 8 15 5 NA NA 7 6 9 12 14 #remove rows with NA value in any column data frame df <- df[complete.cases(df), ] #view data frame df x y z 2 24 3 7 4 6 8 15 6 9 12 14
Exemple 3 : Supprimer les lignes avec NA dans des colonnes spécifiques du bloc de données
Le code suivant montre comment supprimer des lignes avec des valeurs NA dans des colonnes spécifiques d’un bloc de données :
#define data frame df <- data.frame(x=c(1, 24, NA, 6, NA, 9), y=c(NA, 3, 4, 8, NA, 12), z=c(NA, 7, 5, 15, 7, 14)) #view data frame df x y z 1 1 NA NA 2 24 3 7 3 NA 4 5 4 6 8 15 5 NA NA 7 6 9 12 14 #remove rows with NA value in y or z column df <- df[complete.cases(df[ , c('y', 'z')]), ] #view data frame df x y z 2 24 3 7 3 NA 4 5 4 6 8 15 6 9 12 14
Ressources additionnelles
Comment utiliser « Is Not NA » dans R
Comment imputer les valeurs manquantes dans R
Comment remplacer les NA par des chaînes dans R