Pandas에서 두 열을 비교하는 방법: 예제 포함
Pandas DataFrame의 두 열을 비교하고 비교 결과를 세 번째 열에 쓰는 경우가 종종 있습니다.
다음 구문을 사용하면 쉽게 이 작업을 수행할 수 있습니다.
conditions=[(condition1),(condition2)] choices=[" choice1 "," choice2 "] df[" new_column_name "]=np. select (conditions, choices, default)
이 코드의 기능은 다음과 같습니다.
- 조건은 두 열 사이를 확인하는 조건입니다.
- 선택 사항은 조건에 따라 반환되는 결과입니다.
- np.select는 새 열에 결과를 반환하는 데 사용됩니다.
다음 예제에서는 이 코드를 실제로 사용하는 방법을 보여줍니다.
예: Pandas의 두 열 비교
다섯 번의 서로 다른 경기에서 두 축구팀이 득점한 골 수를 보여주는 다음과 같은 DataFrame이 있다고 가정합니다.
import numpy as np import pandas as pd #createDataFrame df = pd. DataFrame ({' A_points ': [1, 3, 3, 3, 5], ' B_points ': [4, 5, 2, 3, 2]}) #view DataFrame df A_points B_points 0 1 4 1 3 5 2 3 2 3 3 3 4 5 2
다음 코드를 사용하여 행당 골 수를 비교하고 세 번째 열에 경기 승자를 표시할 수 있습니다.
#define conditions conditions = [df[' A_points '] > df[' B_points '], df[' A_points '] < df[' B_points ']] #define choices choices = [' A ', ' B '] #create new column in DataFrame that displays results of comparisons df[' winner '] = np. select (conditions, choices, default=' Tie ') #view the DataFrame df A_points B_points winner 0 1 4 B 1 3 5 B 2 3 2 A 3 3 3 Tie 4 5 2 A
비교 결과는 Winner 라는 새 열에 표시됩니다.
코멘트
Pandas DataFrame의 두 열을 비교할 때 명심해야 할 몇 가지 사항은 다음과 같습니다.
- 조건 과 선택 의 개수는 동일해야 합니다.
- 기본값은 어떤 조건도 충족되지 않을 경우 새 열에 표시할 값을 지정합니다.
- 이 코드가 작동하려면 NumPy 와 Pandas가 필요합니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 열 이름을 바꾸는 방법
Pandas DataFrame에 열을 추가하는 방법
Pandas DataFrame에서 열 순서를 변경하는 방법