So fügen sie mehrere pandas-dataframes hinzu (mit beispiel)
Sie können die folgende grundlegende Syntax verwenden, um mehrere Pandas-DataFrames gleichzeitig hinzuzufügen:
import pandas as pd #append multiple DataFrames df_big = pd. concat ([df1,df2, df3], ignore_index= True )
Diese spezielle Syntax fügt df1 , df2 und df3 zu einem einzigen Pandas-DataFrame namens df_big hinzu.
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel 1: Mehrere Pandas DataFrames gleichzeitig hinzufügen
Der folgende Code zeigt, wie Sie mehrere Pandas-DataFrames gleichzeitig hinzufügen:
import pandas as pd #create three DataFrames df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}) df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}) df3 = pd. DataFrame ({'player': ['K', 'L', 'M', 'N', 'O'], 'points':[9, 5, 5, 13, 17]}) #append all DataFrames into one DataFrame df_big = pd. concat ([df1,df2, df3], ignore_index= True ) #view resulting DataFrame print (df_big) player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 5 F 24 6 G 26 7:27 a.m. 8 I 27 9 D 12 10K 9 11 L 5 12 M 5 13 N 13 14 O 17
Das Ergebnis ist ein großer DataFrame, der alle Zeilen aus jedem der drei einzelnen DataFrames enthält.
Das Argument „ignore_index=True“ weist Pandas an, die ursprünglichen Indexnummern in jedem DataFrame zu ignorieren und einen neuen Index zu erstellen, der bei 0 für den neuen DataFrame beginnt.
Überlegen Sie beispielsweise, was passiert, wenn wir „ignore_index=True“ beim Stapeln der folgenden zwei DataFrames nicht verwenden:
import pandas as pd #create two DataFrames with indices df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}, index=[0, 1, 2, 3, 4]) df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}, index=[2, 4, 5, 6, 9]) #stack the two DataFrames together df_big = pd. concat ([df1,df2]) #view resulting DataFrame print (df_big) player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 2 F 24 4G 26 5:27 a.m. 6 I 27 9 D 12
Der resultierende DataFrame behielt seine ursprünglichen Indexwerte beider DataFrames bei.
Im Allgemeinen sollten Sie „ignore_index=True“ verwenden, wenn Sie mehrere DataFrames hinzufügen, es sei denn, Sie haben einen bestimmten Grund, die ursprünglichen Indexwerte beizubehalten.
Zusätzliche Ressourcen
So fügen Sie einem Pandas DataFrame eine leere Spalte hinzu
So fügen Sie eine Spalte in einen Pandas DataFrame ein
So exportieren Sie einen Pandas DataFrame nach Excel