Comment transposer une trame de données à l’aide de dplyr



Vous pouvez utiliser la syntaxe de base suivante pour transposer une trame de données à l’aide du package dplyr dans R :

library(dplyr)
library(tidyr)

df %>%
    pivot_wider(names_from = column1, values_from = column2)

L’argument Names_from spécifie les valeurs à utiliser pour les noms de colonnes dans le bloc de données transposé et l’argument Values_from spécifie les valeurs de cellule à utiliser dans le bloc de données transposé.

Notez que l’opérateur pipe ( %>% ) provient du package dplyr tandis que la fonction pivot_wider() provient du package Tidyr .

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : transposer une trame de données à l’aide de dplyr

Supposons que nous ayons le bloc de données suivant dans R qui contient des informations sur diverses équipes de basket-ball :

#create data frame
df <- data.frame(team=c('Mavs', 'Nets', 'Kings', 'Lakers'),
                 points=c(99, 104, 119, 113))

#view data frame
df

    team points
1   Mavs     99
2   Nets    104
3  Kings    119
4 Lakers    113

Supposons maintenant que nous souhaitions transposer le bloc de données afin que les noms d’équipe soient utilisés comme noms de colonnes et que les valeurs de points soient utilisées comme valeurs de cellules à l’intérieur du bloc de données.

Nous pouvons utiliser la syntaxe suivante pour ce faire :

library(dplyr)
library(tidyr)

#transpose data frame
df %>%
    pivot_wider(names_from = team, values_from = points)

# A tibble: 1 x 4
   Mavs  Nets Kings Lakers
      
1    99   104   119    113

Le bloc de données a été transposé de manière à ce que les noms des équipes soient utilisés comme colonnes et les valeurs de points comme valeurs de cellules dans le bloc de données.

Notez que le bloc de données résultant contient désormais 1 ligne et 4 colonnes.

Connexe : Une introduction à la fonction pivot_wider() dans R

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes à l’aide de dplyr :

Comment filtrer les lignes contenant une certaine chaîne à l’aide de dplyr
Comment calculer les fréquences relatives à l’aide de dplyr
Comment sélectionner la première ligne par groupe à l’aide de dplyr

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *