So führen sie einen outer join in pandas durch (mit beispiel)
Ein äußerer Join ist ein Join-Typ, der alle Zeilen aus zwei Pandas-DataFrames zurückgibt.
Sie können die folgende grundlegende Syntax verwenden, um einen Outer-Join in Pandas durchzuführen:
import pandas as pd df1. merge (df2, on=' some_column ', how=' outer ')
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: So führen Sie einen Outer Join in Pandas durch
Nehmen wir an, wir haben die folgenden zwei Panda-DataFrames, die Informationen über verschiedene Basketballteams enthalten:
import pandas as pd #createDataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28]}) df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'J', 'K'], ' assists ': [4, 9, 14, 13, 10, 8]}) #view DataFrames print (df1) team points 0 to 18 1 B 22 2 C 19 3 D 14 4 E 14 5 F 11 6 G 20 7:28 a.m. print (df2) team assists 0 to 4 1 B 9 2 C 14 3 D 13 4 D 10 5K 8
Wir können den folgenden Code verwenden, um einen Outer-Join durchzuführen, der Zeilen zwischen DataFrames basierend auf den Teamspaltenwerten abgleicht und alle Zeilen aus beiden DataFrames behält:
#perform outer join
df1. merge (df2, on=' team ', how=' outer ')
team points assists
0 to 18.0 4.0
1 B 22.0 9.0
2 C 19.0 14.0
3D 14.0 13.0
4 E 14.0 NaN
5 F 11.0 NaN
6G 20.0 NaN
7 H 28.0 NaN
8 J NaN 10.0
9K NaN 8.0
Das Ergebnis ist ein DataFrame, der alle Zeilen in jedem DataFrame enthält.
Beachten Sie, dass NaN- Werte für jede Zeile ausgefüllt wurden, in der der Teamspaltenwert nicht in beiden DataFrames vorhanden war.
Hinweis : Die vollständige Dokumentation zur Merge- Funktion finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So führen Sie einen Anti-Join in Pandas durch
So führen Sie einen Inner Join in Pandas durch
So führen Sie einen Cross-Join in Pandas durch