So fügen sie mehrere pandas-dataframes hinzu (mit beispiel)


Sie können die folgende grundlegende Syntax verwenden, um mehrere Pandas-DataFrames gleichzeitig hinzuzufügen:

 import pandas as pd

#append multiple DataFrames
df_big = pd. concat ([df1,df2, df3], ignore_index= True ) 

Diese spezielle Syntax fügt df1 , df2 und df3 zu einem einzigen Pandas-DataFrame namens df_big hinzu.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel 1: Mehrere Pandas DataFrames gleichzeitig hinzufügen

Der folgende Code zeigt, wie Sie mehrere Pandas-DataFrames gleichzeitig hinzufügen:

 import pandas as pd

#create three DataFrames
df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'],
                    'points':[12, 5, 13, 17, 27]})

df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'],
                    'points':[24, 26, 27, 27, 12]})

df3 = pd. DataFrame ({'player': ['K', 'L', 'M', 'N', 'O'],
                    'points':[9, 5, 5, 13, 17]})

#append all DataFrames into one DataFrame
df_big = pd. concat ([df1,df2, df3], ignore_index= True )

#view resulting DataFrame
print (df_big)

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
5 F 24
6 G 26
7:27 a.m.
8 I 27
9 D 12
10K 9
11 L 5
12 M 5
13 N 13
14 O 17

Das Ergebnis ist ein großer DataFrame, der alle Zeilen aus jedem der drei einzelnen DataFrames enthält.

Das Argument „ignore_index=True“ weist Pandas an, die ursprünglichen Indexnummern in jedem DataFrame zu ignorieren und einen neuen Index zu erstellen, der bei 0 für den neuen DataFrame beginnt.

Überlegen Sie beispielsweise, was passiert, wenn wir „ignore_index=True“ beim Stapeln der folgenden zwei DataFrames nicht verwenden:

 import pandas as pd

#create two DataFrames with indices
df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'],
                    'points':[12, 5, 13, 17, 27]},
                    index=[0, 1, 2, 3, 4])

df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'],
                    'points':[24, 26, 27, 27, 12]},
                    index=[2, 4, 5, 6, 9])

#stack the two DataFrames together
df_big = pd. concat ([df1,df2])

#view resulting DataFrame
print (df_big)

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
2 F 24
4G 26
5:27 a.m.
6 I 27
9 D 12

Der resultierende DataFrame behielt seine ursprünglichen Indexwerte beider DataFrames bei.

Im Allgemeinen sollten Sie „ignore_index=True“ verwenden, wenn Sie mehrere DataFrames hinzufügen, es sei denn, Sie haben einen bestimmten Grund, die ursprünglichen Indexwerte beizubehalten.

Zusätzliche Ressourcen

So fügen Sie einem Pandas DataFrame eine leere Spalte hinzu
So fügen Sie eine Spalte in einen Pandas DataFrame ein
So exportieren Sie einen Pandas DataFrame nach Excel

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert