Comment fusionner des trames de données par noms de lignes dans R



Vous pouvez utiliser la syntaxe de base suivante pour fusionner deux blocs de données dans R en fonction de leurs noms de lignes :

#inner join
merge(df1, df2, by=0)

#left join
merge(df1, df2, by=0, all.x=TRUE)

#outer join
merge(df1, df2, by=0, all=TRUE)

En utilisant l’argument by=0 , nous pouvons indiquer à R que nous souhaitons fusionner en utilisant les noms de lignes des blocs de données.

Les exemples suivants montrent comment utiliser chaque méthode avec les deux trames de données suivantes :

#create first data frame
df1 <- data.frame(points=c(99, 90, 86, 88, 95),
                  assists=c(33, 28, 31, 39, 34))

rownames(df1) <- c(1, 2, 3, 4, 5)

df1

  points assists
1     99      33
2     90      28
3     86      31
4     88      39
5     95      34

#create second data frame
df2 <- data.frame(rebounds=c(17, 15, 22, 26, 25),
                  blocks=c(7, 7, 15, 12, 14))

rownames(df2) <- c(3, 4, 5, 6, 7)

df2

  rebounds blocks
3       17      7
4       15      7
5       22     15
6       26     12
7       25     14

Exemple 1 : effectuer une jointure interne à l’aide de noms de lignes

Le code suivant montre comment effectuer une jointure interne sur deux trames de données à l’aide des noms de lignes :

#perform inner join using row names
merge(df1, df2, by=0)

  Row.names points assists rebounds blocks
1         3     86      31       17      7
2         4     88      39       15      7
3         5     95      34       22     15

Notez que seules les lignes dont les noms de ligne appartiennent aux deux blocs de données sont conservées dans le bloc de données fusionné final.

Exemple 2 : effectuer une jointure à gauche en utilisant les noms de lignes

Le code suivant montre comment effectuer une jointure gauche sur deux trames de données à l’aide des noms de lignes :

#perform left join using row names
merge(df1, df2, by=0, all.x=TRUE)

  Row.names points assists rebounds blocks
1         1     99      33       NA     NA
2         2     90      28       NA     NA
3         3     86      31       17      7
4         4     88      39       15      7
5         5     95      34       22     15

Notez que toutes les lignes du premier bloc de données sont conservées dans le bloc de données final fusionné.

Exemple 3 : effectuer une jointure externe à l’aide de noms de lignes

Le code suivant montre comment effectuer une jointure externe sur deux trames de données à l’aide des noms de lignes :

#perform outer join using row names
merge(df1, df2, by=0, all=TRUE)

  Row.names points assists rebounds blocks
1         1     99      33       NA     NA
2         2     90      28       NA     NA
3         3     86      31       17      7
4         4     88      39       15      7
5         5     95      34       22     15
6         6     NA      NA       26     12
7         7     NA      NA       25     14

Notez que toutes les lignes des deux blocs de données sont conservées dans le bloc de données final fusionné.

Ressources additionnelles

Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes liées aux trames de données dans R :

Comment faire une jointure à gauche dans R
Comment effectuer une RECHERCHEV dans R
Comment ajouter des lignes au bloc de données dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *