Comment transposer une trame de données à l’aide de dplyr
Vous pouvez utiliser la syntaxe de base suivante pour transposer une trame de données à l’aide du package dplyr dans R :
library(dplyr) library(tidyr) df %>% pivot_wider(names_from = column1, values_from = column2)
L’argument Names_from spécifie les valeurs à utiliser pour les noms de colonnes dans le bloc de données transposé et l’argument Values_from spécifie les valeurs de cellule à utiliser dans le bloc de données transposé.
Notez que l’opérateur pipe ( %>% ) provient du package dplyr tandis que la fonction pivot_wider() provient du package Tidyr .
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : transposer une trame de données à l’aide de dplyr
Supposons que nous ayons le bloc de données suivant dans R qui contient des informations sur diverses équipes de basket-ball :
#create data frame df <- data.frame(team=c('Mavs', 'Nets', 'Kings', 'Lakers'), points=c(99, 104, 119, 113)) #view data frame df team points 1 Mavs 99 2 Nets 104 3 Kings 119 4 Lakers 113
Supposons maintenant que nous souhaitions transposer le bloc de données afin que les noms d’équipe soient utilisés comme noms de colonnes et que les valeurs de points soient utilisées comme valeurs de cellules à l’intérieur du bloc de données.
Nous pouvons utiliser la syntaxe suivante pour ce faire :
library(dplyr) library(tidyr) #transpose data frame df %>% pivot_wider(names_from = team, values_from = points) # A tibble: 1 x 4 Mavs Nets Kings Lakers 1 99 104 119 113
Le bloc de données a été transposé de manière à ce que les noms des équipes soient utilisés comme colonnes et les valeurs de points comme valeurs de cellules dans le bloc de données.
Notez que le bloc de données résultant contient désormais 1 ligne et 4 colonnes.
Connexe : Une introduction à la fonction pivot_wider() dans R
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes à l’aide de dplyr :
Comment filtrer les lignes contenant une certaine chaîne à l’aide de dplyr
Comment calculer les fréquences relatives à l’aide de dplyr
Comment sélectionner la première ligne par groupe à l’aide de dplyr