Comment ajouter plusieurs DataFrames Pandas (avec exemple)
Vous pouvez utiliser la syntaxe de base suivante pour ajouter plusieurs DataFrames pandas à la fois :
import pandas as pd #append multiple DataFrames df_big = pd.concat([df1,df2, df3], ignore_index=True)
Cette syntaxe particulière ajoutera df1 , df2 et df3 dans un seul DataFrame pandas appelé df_big .
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple 1 : ajouter plusieurs DataFrames Pandas à la fois
Le code suivant montre comment ajouter plusieurs DataFrames pandas à la fois :
import pandas as pd #create three DataFrames df1 = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}) df2 = pd.DataFrame({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}) df3 = pd.DataFrame({'player': ['K', 'L', 'M', 'N', 'O'], 'points':[9, 5, 5, 13, 17]}) #append all DataFrames into one DataFrame df_big = pd.concat([df1,df2, df3], ignore_index=True) #view resulting DataFrame print(df_big) player points 0 A 12 1 B 5 2 C 13 3 D 17 4 E 27 5 F 24 6 G 26 7 H 27 8 I 27 9 J 12 10 K 9 11 L 5 12 M 5 13 N 13 14 O 17
Le résultat est un gros DataFrame qui contient toutes les lignes de chacun des trois DataFrames individuels.
L’argument ignore_index=True indique aux pandas d’ignorer les numéros d’index d’origine dans chaque DataFrame et de créer un nouvel index qui commence à 0 pour le nouveau DataFrame.
Par exemple, considérons ce qui se passe lorsque nous n’utilisons pas ignore_index=True lors de l’empilement des deux DataFrames suivants :
import pandas as pd #create two DataFrames with indices df1 = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}, index=[0, 1, 2, 3, 4]) df2 = pd.DataFrame({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}, index=[2, 4, 5, 6, 9]) #stack the two DataFrames together df_big = pd.concat([df1,df2]) #view resulting DataFrame print(df_big) player points 0 A 12 1 B 5 2 C 13 3 D 17 4 E 27 2 F 24 4 G 26 5 H 27 6 I 27 9 J 12
Le DataFrame résultant a conservé ses valeurs d’index d’origine des deux DataFrames.
En général, vous devez utiliser ignore_index=True lors de l’ajout de plusieurs DataFrames, sauf si vous avez une raison spécifique de conserver les valeurs d’index d’origine.
Ressources additionnelles
Comment ajouter une colonne vide à un DataFrame Pandas
Comment insérer une colonne dans un DataFrame Pandas
Comment exporter un DataFrame Pandas vers Excel