Pandas: so führen sie zwei dataframes mit unterschiedlichen spaltennamen zusammen


Sie können die folgende grundlegende Syntax verwenden, um zwei Pandas-DataFrames mit unterschiedlichen Spaltennamen zusammenzuführen:

 p.d. merge (df1, df2, left_on=' left_column_name ', right_on=' right_column_name ')

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Zwei Pandas DataFrames mit unterschiedlichen Spaltennamen zusammenführen

Nehmen wir an, wir haben die folgenden zwei Panda-DataFrames:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [4, 4, 6, 8, 9, 5]})

#view DataFrame
print (df1)

  team points
0 to 4
1 B 4
2 C 6
3 D 8
4 E 9
5 F 5

#create second DataFrame
df2 = pd. DataFrame ({' team_name ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' rebounds ': [12, 7, 8, 8, 5, 11]})

#view DataFrame
print (df2)

  team_name rebounds
0 to 12
1 B 7
2 C 8
3 D 8
4 E 5
5 F 11

Wir können die folgende Syntax verwenden, um einen Inner Join durchzuführen, indem wir die Spalte „team“ im ersten DataFrame und die Spalte „team_name“ im zweiten DataFrame verwenden:

 #merge DataFrames
df3 = pd. merge (df1, df2, left_on=' team ', right_on=' team_name ')

#view result
print (df3)

  team points team_name rebounds
0 A 4 A 12
1 B 4 B 7
2 C 6 C 8
3 D 8 D 8
4 E 9 E 5
5 F 5 F 11

Beachten Sie, dass wir einen Inner Join erfolgreich durchführen können, obwohl die beiden Spaltennamen, die wir für den Join verwendet haben, in jedem DataFrame unterschiedlich waren.

Beachten Sie, dass wir auch den folgenden Code verwenden können, um die Spalte „team_name“ aus dem endgültigen zusammengeführten DataFrame zu entfernen, da die Werte in dieser Spalte mit denen in der Spalte „team“ übereinstimmen:

 #drop team_name column
df3. drop (' team_name ', axis= 1 , inplace= True )

#view updated DataFrame
print (df3)

  team points rebounds
0 to 4 12
1 B 4 7
2 C 6 8
3 D 8 8
4 E 9 5
5 F 5 11

Beachten Sie, dass die Spalte „team_name“ aus dem DataFrame entfernt wurde.

Verwandte Themen: So löschen Sie Spalten in Pandas (4 Beispiele)

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Panda-Aufgaben ausführen:

So ändern Sie die Spaltenreihenfolge in Pandas
So benennen Sie Spalten in Pandas um
So sortieren Sie Spalten in Pandas nach Namen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert