Comment concaténer deux DataFrames Pandas (avec exemples)
Vous pouvez utiliser la syntaxe de base suivante pour concaténer deux DataFrames pandas :
df3 = pd.concat([df1, df2], ignore_index=True)
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : Comment concaténer deux DataFrames Pandas
Supposons que nous ayons les deux DataFrames pandas suivants :
import pandas as pd #define DataFrames df1 = pd.DataFrame({'team': ['A', 'A', 'A', 'A'], 'assists': [5, 7, 7, 9], 'points': [11, 8, 10, 6]}) df2 = pd.DataFrame({'team': ['B', 'B', 'B', 'B'], 'assists': [4, 4, 3, 7], 'points': [14, 11, 7, 6]}) #view DataFrames print(df1) team assists points 0 A 5 11 1 A 7 8 2 A 7 10 3 A 9 6 print(df2) team assists points 0 B 4 14 1 B 4 11 2 B 3 7 3 B 7 6
Nous pouvons utiliser la syntaxe suivante pour concaténer les deux DataFrames :
#concatenate the DataFrames
df3 = pd.concat([df1, df2])
#view resulting DataFrame
print(df3)
team assists points
0 A 5 11
1 A 7 8
2 A 7 10
3 A 9 6
0 B 4 14
1 B 4 11
2 B 3 7
3 B 7 6
Le résultat est un DataFrame qui contient les données des deux DataFrames.
Si vous souhaitez créer un nouvel index lors de la concaténation des DataFrames, vous devez utiliser l’argument ignore_index :
#concatenate the DataFrames and ignore index
df3 = pd.concat([df1, df2], ignore_index=True)
#view resulting DataFrame
print(df3)
team assists points
0 A 5 11
1 A 7 8
2 A 7 10
3 A 9 6
4 B 4 14
5 B 4 11
6 B 3 7
7 B 7 6
Notez que l’index du DataFrame résultant est compris entre 0 et 7.
Remarque n°1 : Dans cet exemple, nous avons concaténé deux DataFrames pandas, mais vous pouvez utiliser cette syntaxe exacte pour concaténer le nombre de DataFrames que vous souhaitez.
Remarque n°2 : Vous pouvez trouver la documentation complète de la fonction pandas concat() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment fusionner des DataFrames Pandas sur plusieurs colonnes
Comment fusionner deux DataFrames Pandas sur l’index
Comment ajouter une colonne à un DataFrame Pandas