Comment fusionner des trames de données par noms de lignes dans R
Vous pouvez utiliser la syntaxe de base suivante pour fusionner deux blocs de données dans R en fonction de leurs noms de lignes :
#inner join merge(df1, df2, by=0) #left join merge(df1, df2, by=0, all.x=TRUE) #outer join merge(df1, df2, by=0, all=TRUE)
En utilisant l’argument by=0 , nous pouvons indiquer à R que nous souhaitons fusionner en utilisant les noms de lignes des blocs de données.
Les exemples suivants montrent comment utiliser chaque méthode avec les deux trames de données suivantes :
#create first data frame
df1 <- data.frame(points=c(99, 90, 86, 88, 95),
assists=c(33, 28, 31, 39, 34))
rownames(df1) <- c(1, 2, 3, 4, 5)
df1
points assists
1 99 33
2 90 28
3 86 31
4 88 39
5 95 34
#create second data frame
df2 <- data.frame(rebounds=c(17, 15, 22, 26, 25),
blocks=c(7, 7, 15, 12, 14))
rownames(df2) <- c(3, 4, 5, 6, 7)
df2
rebounds blocks
3 17 7
4 15 7
5 22 15
6 26 12
7 25 14
Exemple 1 : effectuer une jointure interne à l’aide de noms de lignes
Le code suivant montre comment effectuer une jointure interne sur deux trames de données à l’aide des noms de lignes :
#perform inner join using row names
merge(df1, df2, by=0)
Row.names points assists rebounds blocks
1 3 86 31 17 7
2 4 88 39 15 7
3 5 95 34 22 15
Notez que seules les lignes dont les noms de ligne appartiennent aux deux blocs de données sont conservées dans le bloc de données fusionné final.
Exemple 2 : effectuer une jointure à gauche en utilisant les noms de lignes
Le code suivant montre comment effectuer une jointure gauche sur deux trames de données à l’aide des noms de lignes :
#perform left join using row names
merge(df1, df2, by=0, all.x=TRUE)
Row.names points assists rebounds blocks
1 1 99 33 NA NA
2 2 90 28 NA NA
3 3 86 31 17 7
4 4 88 39 15 7
5 5 95 34 22 15
Notez que toutes les lignes du premier bloc de données sont conservées dans le bloc de données final fusionné.
Exemple 3 : effectuer une jointure externe à l’aide de noms de lignes
Le code suivant montre comment effectuer une jointure externe sur deux trames de données à l’aide des noms de lignes :
#perform outer join using row names
merge(df1, df2, by=0, all=TRUE)
Row.names points assists rebounds blocks
1 1 99 33 NA NA
2 2 90 28 NA NA
3 3 86 31 17 7
4 4 88 39 15 7
5 5 95 34 22 15
6 6 NA NA 26 12
7 7 NA NA 25 14
Notez que toutes les lignes des deux blocs de données sont conservées dans le bloc de données final fusionné.
Ressources additionnelles
Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes liées aux trames de données dans R :
Comment faire une jointure à gauche dans R
Comment effectuer une RECHERCHEV dans R
Comment ajouter des lignes au bloc de données dans R