Pandas 조인 또는 병합: 차이점은 무엇인가요?


Join()merge() 함수를 사용하여 두 개의 Pandas DataFrame을 결합할 수 있습니다.

두 기능의 주요 차이점은 다음과 같습니다.

  • Join() 함수는 두 개의 DataFrame을 인덱스로 결합합니다.
  • merge() 함수는 지정한 열을 기반으로 두 개의 DataFrame을 결합합니다.

이러한 함수는 다음과 같은 기본 구문을 사용합니다.

 #use join() to combine two DataFrames by index
df1. join (df2)

#use merge() to combine two DataFrames by specific column name
df1. merge (df2,on=' column_name ')

두 개의 DataFrame을 인덱스로 결합하려는 경우에는 Join() 함수를 사용하여 입력을 줄일 수 있습니다.

다음 예에서는 각 기능을 실제로 사용하는 방법을 보여줍니다.

예시 1: Join() 함수 사용 방법

다음 코드는 Join() 함수를 사용하여 두 DataFrame을 결합하는 방법을 보여줍니다.

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. join (df2)

	steal points
name		
At 8 4
B 12 5
C 19 2

기본적으로 Join() 함수는 인덱스 열을 사용하여 두 DataFrame을 결합했습니다.

예시 2: merge() 함수를 사용하는 방법

다음 코드는 merge() 함수를 사용하여 두 DataFrame을 결합하는 방법을 보여줍니다.

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. merge (df2, on=' name ')

	steal points
name		
At 8 4
B 12 5
C 19 2

merge() 함수는 정확히 동일한 결과를 반환했지만 “name” 열을 사용하여 DataFrames를 조인하도록 팬더에게 명시적으로 지시해야 했습니다.

추가 리소스

여기에서 Join()merge() 함수에 대한 전체 온라인 설명서를 찾을 수 있습니다.

Join() 함수에 대한 문서
merge() 함수에 대한 문서

다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.

Pandas DataFrame에 행을 추가하는 방법
Pandas DataFrame에 헤더 행을 추가하는 방법
Pandas DataFrame의 첫 번째 행을 얻는 방법
Pandas DataFrame에서 첫 번째 열을 얻는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다