Pandas에서 외부 조인을 수행하는 방법(예제 포함)
외부 조인은 두 개의 Pandas DataFrame에서 모든 행을 반환하는 조인 유형입니다.
다음 기본 구문을 사용하여 Pandas에서 외부 조인을 수행할 수 있습니다.
import pandas as pd df1. merge (df2, on=' some_column ', how=' outer ')
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: Pandas에서 외부 조인을 수행하는 방법
다양한 농구팀에 대한 정보가 포함된 다음 두 개의 팬더 DataFrame이 있다고 가정해 보겠습니다.
import pandas as pd #createDataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28]}) df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'J', 'K'], ' assists ': [4, 9, 14, 13, 10, 8]}) #view DataFrames print (df1) team points 0 to 18 1 B 22 2 C 19 3 D 14 4 E 14 5 F 11 6 G 20 7:28 a.m. print (df2) team assists 0 to 4 1 B 9 2 C 14 3 D 13 4 D 10 5K 8
다음 코드를 사용하여 팀 열 값을 기반으로 DataFrame 간의 행을 일치시키고 두 DataFrame의 모든 행을 유지하는 외부 조인을 수행할 수 있습니다.
#perform outer join
df1. merge (df2, on=' team ', how=' outer ')
team points assists
0 to 18.0 4.0
1 B 22.0 9.0
2 C 19.0 14.0
3D 14.0 13.0
4 E 14.0 NaN
5 F 11.0 NaN
6G 20.0 NaN
7 H 28.0 NaN
8 J NaN 10.0
9K NaN 8.0
결과는 각 DataFrame의 모든 행을 포함하는 DataFrame입니다.
두 DataFrame 모두에서 팀 열 값이 존재하지 않는 각 행에 대해 NaN 값이 채워졌습니다.
참고 : 여기에서 병합 기능에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 안티 조인을 수행하는 방법
Pandas에서 내부 조인을 수행하는 방법
Pandas에서 교차 조인을 수행하는 방법