Pandas 조인 또는 병합: 차이점은 무엇인가요?
Join() 및 merge() 함수를 사용하여 두 개의 Pandas DataFrame을 결합할 수 있습니다.
두 기능의 주요 차이점은 다음과 같습니다.
- Join() 함수는 두 개의 DataFrame을 인덱스로 결합합니다.
- merge() 함수는 지정한 열을 기반으로 두 개의 DataFrame을 결합합니다.
이러한 함수는 다음과 같은 기본 구문을 사용합니다.
#use join() to combine two DataFrames by index df1. join (df2) #use merge() to combine two DataFrames by specific column name df1. merge (df2,on=' column_name ')
두 개의 DataFrame을 인덱스로 결합하려는 경우에는 Join() 함수를 사용하여 입력을 줄일 수 있습니다.
다음 예에서는 각 기능을 실제로 사용하는 방법을 보여줍니다.
예시 1: Join() 함수 사용 방법
다음 코드는 Join() 함수를 사용하여 두 DataFrame을 결합하는 방법을 보여줍니다.
import pandas as pd #create two DataFrames df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ') df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ') #view two DataFrames print (df1); print (df2) steal points name name A 8 A 4 B 12 B 5 C 19 C 2 #use join() function to join together two DataFrames df1. join (df2) steal points name At 8 4 B 12 5 C 19 2
기본적으로 Join() 함수는 인덱스 열을 사용하여 두 DataFrame을 결합했습니다.
예시 2: merge() 함수를 사용하는 방법
다음 코드는 merge() 함수를 사용하여 두 DataFrame을 결합하는 방법을 보여줍니다.
import pandas as pd #create two DataFrames df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ') df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ') #view two DataFrames print (df1); print (df2) steal points name name A 8 A 4 B 12 B 5 C 19 C 2 #use join() function to join together two DataFrames df1. merge (df2, on=' name ') steal points name At 8 4 B 12 5 C 19 2
merge() 함수는 정확히 동일한 결과를 반환했지만 “name” 열을 사용하여 DataFrames를 조인하도록 팬더에게 명시적으로 지시해야 했습니다.
추가 리소스
여기에서 Join() 및 merge() 함수에 대한 전체 온라인 설명서를 찾을 수 있습니다.
Join() 함수에 대한 문서
merge() 함수에 대한 문서
다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.
Pandas DataFrame에 행을 추가하는 방법
Pandas DataFrame에 헤더 행을 추가하는 방법
Pandas DataFrame의 첫 번째 행을 얻는 방법
Pandas DataFrame에서 첫 번째 열을 얻는 방법