Pandas에서 두 열을 비교하는 방법: 예제 포함


Pandas DataFrame의 두 열을 비교하고 비교 결과를 세 번째 열에 쓰는 경우가 종종 있습니다.

다음 구문을 사용하면 쉽게 이 작업을 수행할 수 있습니다.

 conditions=[(condition1),(condition2)]
choices=[" choice1 "," choice2 "]

df[" new_column_name "]=np. select (conditions, choices, default)

이 코드의 기능은 다음과 같습니다.

  • 조건은 두 열 사이를 확인하는 조건입니다.
  • 선택 사항은 조건에 따라 반환되는 결과입니다.
  • np.select는 새 열에 결과를 반환하는 데 사용됩니다.

다음 예제에서는 이 코드를 실제로 사용하는 방법을 보여줍니다.

예: Pandas의 두 열 비교

다섯 번의 서로 다른 경기에서 두 축구팀이 득점한 골 수를 보여주는 다음과 같은 DataFrame이 있다고 가정합니다.

 import numpy as np
import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A_points ': [1, 3, 3, 3, 5],
                   ' B_points ': [4, 5, 2, 3, 2]})
             
#view DataFrame      
df

          A_points B_points
0 1 4
1 3 5
2 3 2
3 3 3
4 5 2

다음 코드를 사용하여 행당 골 수를 비교하고 세 번째 열에 경기 승자를 표시할 수 있습니다.

 #define conditions
conditions = [df[' A_points '] > df[' B_points '], 
              df[' A_points '] < df[' B_points ']]

#define choices
choices = [' A ', ' B ']

#create new column in DataFrame that displays results of comparisons
df[' winner '] = np. select (conditions, choices, default=' Tie ')

#view the DataFrame
df

          A_points B_points winner
0 1 4 B
1 3 5 B
2 3 2 A
3 3 3 Tie
4 5 2 A

비교 결과는 Winner 라는 새 열에 표시됩니다.

코멘트

Pandas DataFrame의 두 열을 비교할 때 명심해야 할 몇 가지 사항은 다음과 같습니다.

  • 조건선택 의 개수는 동일해야 합니다.
  • 기본값은 어떤 조건도 충족되지 않을 경우 새 열에 표시할 값을 지정합니다.
  • 이 코드가 작동하려면 NumPyPandas가 필요합니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 열 이름을 바꾸는 방법
Pandas DataFrame에 열을 추가하는 방법
Pandas DataFrame에서 열 순서를 변경하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다