Comment inclure NA dans l’instruction ifelse dans R



Souvent, vous souhaiterez peut-être utiliser une instruction ifelse dans R pour créer une nouvelle colonne dans un bloc de données dont les valeurs sont basées sur les valeurs d’une colonne existante.

Pour ce faire, vous pouvez utiliser la syntaxe de base suivante :

df$new_column<- ifelse(df$col1=='A', 'val_if_true', 'val_if_false') 

Cependant, si des valeurs NA sont présentes dans une colonne, alors les valeurs de la nouvelle colonne seront automatiquement NA.

Pour éviter cela, vous pouvez utiliser la fonction !is.na() comme suit :

df$new_column<- ifelse(df$col1=='A' & !is.na(df$col1), 'val_if_true', 'val_if_false') 

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : inclure NA dans l’instruction ifelse dans R

Supposons que nous ayons le bloc de données suivant dans R qui contient des informations sur divers joueurs de basket-ball :

#create data frame
df <- data.frame(player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 conf=c('West', NA, 'West', 'East', 'East', 'East'),
                 points=c(30, 35, 11, 18, 14, NA))

#view data frame
df

  player conf points
1      A West     30
2      B <NA>     35
3      C West     11
4      D East     18
5      E East     14
6      F East     NA

Supposons maintenant que nous essayions de créer une nouvelle colonne appelée classe qui prend les valeurs suivantes :

  • ‘West_Player’ si conf est égal à ‘West’
  • ‘Autre’ si conf n’est pas égal à ‘Ouest’

Le code suivant montre comment procéder :

#create new column called 'class'
df$class <- ifelse(df$conf=='West', 'West_Player', 'Other')

#view updated data frame
df

  player conf points       class
1      A West     30 West_Player
2      B <NA>     35        <NA>
3      C West     11 West_Player
4      D East     18       Other
5      E East     14       Other
6      F East     NA       Other

Notez que la valeur de la classe dans la ligne 2 est égale à NA puisque la valeur correspondante dans la colonne conf était égale à NA.

Pour éviter cela, nous pouvons utiliser la fonction !is.na() comme suit :

#create new column called 'class'
df$class <- ifelse(df$conf=='West' & !is.na(df$conf), 'West_Player', 'Other')

#view updated data frame
df

  player conf points       class
1      A West     30 West_Player
2      B <NA>     35       Other
3      C West     11 West_Player
4      D East     18       Other
5      E East     14       Other
6      F East     NA       Other

Notez que la valeur de la classe dans la ligne 2 est désormais égale à « Autre » au lieu de NA.

En utilisant la fonction !is.na() , nous avons spécifié que la valeur dans la colonne conf doit être égale à ‘West’ et non égale à NA pour que la valeur dans la nouvelle colonne class soit ‘West_Player’.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment écrire une instruction If Else imbriquée dans R
Comment rédiger une déclaration de cas dans R
Comment ajouter plusieurs colonnes au bloc de données dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *