Comment utiliser complete.cases dans R (avec exemples)



Vous pouvez utiliser la fonction complete.cases() dans R pour supprimer les valeurs manquantes dans un vecteur, une matrice ou un bloc de données.

Cette fonction utilise la syntaxe de base suivante :

#remove missing values from vector
x <- x[complete.cases(x)]

#remove rows with missing values in any column of data frame
df <- df[complete.cases(df), ]

#remove rows with NA in specific columns of data frame
df <- df[complete.cases(df[ , c('col1', 'col2', ...)]), ] 

Les exemples suivants montrent comment utiliser cette fonction dans la pratique.

Exemple 1 : Supprimer les valeurs manquantes du vecteur

Le code suivant montre comment supprimer toutes les valeurs NA d’un vecteur :

#define vector
x <- c(1, 24, NA, 6, NA, 9)

#remove NA values from vector
x <- x[complete.cases(x)]

x

[1]  1 24  6  9

Exemple 2 : Supprimer les lignes avec NA dans n’importe quelle colonne du bloc de données

Le code suivant montre comment supprimer les lignes avec des valeurs NA dans n’importe quelle colonne d’un bloc de données :

#define data frame
df <- data.frame(x=c(1, 24, NA, 6, NA, 9),
                 y=c(NA, 3, 4, 8, NA, 12),
                 z=c(NA, 7, 5, 15, 7, 14))

#view data frame
df

   x  y  z
1  1 NA NA
2 24  3  7
3 NA  4  5
4  6  8 15
5 NA NA  7
6  9 12 14

#remove rows with NA value in any column data frame
df <- df[complete.cases(df), ]

#view data frame 
df

   x  y  z
2 24  3  7
4  6  8 15
6  9 12 14

Exemple 3 : Supprimer les lignes avec NA dans des colonnes spécifiques du bloc de données

Le code suivant montre comment supprimer des lignes avec des valeurs NA dans des colonnes spécifiques d’un bloc de données :

#define data frame
df <- data.frame(x=c(1, 24, NA, 6, NA, 9),
                 y=c(NA, 3, 4, 8, NA, 12),
                 z=c(NA, 7, 5, 15, 7, 14))

#view data frame
df

   x  y  z
1  1 NA NA
2 24  3  7
3 NA  4  5
4  6  8 15
5 NA NA  7
6  9 12 14

#remove rows with NA value in y or z column
df <- df[complete.cases(df[ , c('y', 'z')]), ]

#view data frame 
df

   x  y  z
2 24  3  7
3 NA  4  5
4  6  8 15
6  9 12 14

Ressources additionnelles

Comment utiliser « Is Not NA » dans R
Comment imputer les valeurs manquantes dans R
Comment remplacer les NA par des chaînes dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *