Comment créer une table et inclure des valeurs NA dans R



Par défaut, la fonction table() dans R crée un tableau de valeurs de fréquence mais n’inclut pas la fréquence des valeurs NA.

Cependant, vous pouvez utiliser les méthodes suivantes pour créer une table et inclure des valeurs NA :

Méthode 1 : créer un tableau et toujours afficher le nombre de valeurs NA

table(df$my_column, useNA = "always")

Méthode 2 : créer un tableau et afficher uniquement le nombre de valeurs NA s’il y en a

table(df$my_column, useNA = "ifany")

Les exemples suivants montrent comment utiliser chaque méthode dans la pratique.

Exemple 1 : créer un tableau et toujours afficher le nombre de valeurs NA

Supposons que nous ayons le bloc de données suivant dans R qui contient des informations sur divers joueurs de basket-ball :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(20, 25, 14, 18, 19, 12, 12, 15))

#view data frame
df

  team points
1    A     20
2    A     25
3    A     14
4    A     18
5    B     19
6    B     12
7    B     12
8    B     15

Nous pouvons utiliser la syntaxe suivante pour créer un tableau de la fréquence des valeurs dans la colonne équipe et afficher le nombre de valeurs NA, qu’elles existent ou non :

#create frequency table of values in team column, including NA values
table(df$team, useNA = "always")

   A    B  <NA>
   4    4    0 

Notez que le tableau résultant montre qu’il y a 0 valeurs NA dans la colonne équipe du bloc de données.

Puisque nous avons utilisé l’argument useNA = « always » , le tableau affichait toujours le nombre de valeurs NA même s’il n’y en avait pas.

Exemple 2 : créer un tableau et afficher uniquement le nombre de valeurs NA s’il y en a

Supposons encore une fois que nous ayons le bloc de données suivant dans R qui contient des informations sur divers joueurs de basket-ball :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(20, 25, 14, 18, 19, 12, 12, 15))

#view data frame
df

  team points
1    A     20
2    A     25
3    A     14
4    A     18
5    B     19
6    B     12
7    B     12
8    B     15

Nous pouvons utiliser la syntaxe suivante pour créer un tableau pour la fréquence des valeurs dans la colonne équipe et afficher uniquement le nombre de valeurs NA s’il en existe :

#create frequency table of values in team column, including NA values if any exist
table(df$team, useNA = "ifany")

A B 
4 4 

Notez que le tableau résultant montre la fréquence des valeurs « A » et « B » dans la colonne équipe , mais n’affiche pas la fréquence des valeurs NA puisqu’il n’y en a pas.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans R :

Comment créer une table à deux voies dans R
Comment convertir un tableau en matrice dans R
Comment convertir une table en bloc de données dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *