Comment faire une jointure croisée dans R (avec exemple)
Le moyen le plus simple d’effectuer une jointure croisée dans R est d’utiliser la fonction cross() du package Tidyr :
library(tidyr) #perform cross join on df1 and df2 crossing(df1, df2)
L’exemple suivant montre comment utiliser cette fonction dans la pratique.
Exemple : effectuer une jointure croisée dans R
Supposons que nous ayons les deux trames de données suivantes dans R :
#define first data frame df1 = data.frame(team1=c('A', 'B', 'C', 'D'), points=c(18, 22, 19, 14)) df1 team1 points 1 A 18 2 B 22 3 C 19 4 D 14 #define second data frame df2 = data.frame(team2=c('A', 'B', 'F'), assists=c(4, 9, 8)) df2 team2 assists 1 A 4 2 B 9 3 F 8
Nous pouvons utiliser la fonction crossing() du package Tidyr pour effectuer une jointure croisée sur ces deux trames de données :
library(tidyr) #perform cross join cross <- crossing(df1, df2) #view result cross # A tibble: 12 x 4 team1 points team2 assists 1 A 18 A 4 2 A 18 B 9 3 A 18 F 8 4 B 22 A 4 5 B 22 B 9 6 B 22 F 8 7 C 19 A 4 8 C 19 B 9 9 C 19 F 8 10 D 14 A 4 11 D 14 B 9 12 D 14 F 8
Le résultat est un bloc de données contenant toutes les combinaisons possibles de lignes de chaque bloc de données.
Par exemple, la première ligne du premier bloc de données contient l’équipe A et 18 points. Cette ligne correspond à chaque ligne de la deuxième trame de données.
Ensuite, la deuxième ligne du premier bloc de données contient l’équipe B et 22 points. Cette ligne correspond également à chaque ligne de la deuxième trame de données.
Le résultat final est un bloc de données de 12 lignes.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans R :
Comment faire une jointure à gauche dans R
Comment faire une jointure à droite dans R
Comment faire une jointure interne dans R