Pandas: 두 열의 차이점을 찾는 방법


Pandas DataFrame에서 두 열 간의 차이점을 찾으려면 다음 구문을 사용할 수 있습니다.

 df[' difference '] = df[' column1 '] - df[' column2 ']

다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.

예 1: 두 열 간의 차이 찾기

8개의 연속 판매 기간 동안 두 지역(A 및 B)의 총 매출을 표시하는 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' period ': [1, 2, 3, 4, 5, 6, 7, 8],
                   ' A_sales ': [12, 14, 15, 13, 18, 20, 19, 24],
                   ' B_sales ': [14, 19, 20, 22, 24, 20, 17, 23]})

#view DataFrame
df

period A_sales B_sales
0 1 12 14
1 2 14 19
2 3 15 20
3 4 13 22
4 5 18 24
5 6 20 20
6 7 19 17
7 8 24 23

다음 코드는 각 판매 기간에 대해 B 지역과 A 지역의 매출 차이를 계산하는 방법을 보여줍니다.

 #add new column to represent difference between B sales and A sales
df[' diff '] = df[' B_sales '] - df[' A_sales ']

#view DataFrame
df

        period A_sales B_sales diff
0 1 12 14 2
1 2 14 19 5
2 3 15 20 5
3 4 13 22 9
4 5 18 24 6
5 6 20 20 0
6 7 19 17 -2
7 8 24 23 -1

pandas.Series.abs() 함수를 사용하여 매출의 절대 차이를 계산할 수도 있습니다.

 #add new column to represent absolute difference between B sales and A sales
df[' diff '] = pd. Series . abs (df[' B_sales '] - df[' A_sales '])

#view DataFrame
df

	period A_sales B_sales diff
0 1 12 14 2
1 2 14 19 5
2 3 15 20 5
3 4 13 22 9
4 5 18 24 6
5 6 20 20 0
6 7 19 17 2
7 8 24 23 1

예시 2: 조건에 따라 열 간의 차이 찾기

또한 DataFrame을 필터링하여 열 간의 차이가 특정 값보다 작거나 큰 행만 표시할 수도 있습니다.

예를 들어, 다음 코드는 A 지역의 매출이 B 지역의 매출보다 행만 반환합니다.

 #add new column to represent difference between B sales and A sales
df[' diff '] = df[' B_sales '] - df[' A_sales ']

#display rows where sales in region A is greater than sales in region B
df[df[' diff ']< 0 ]


        period A_sales B_sales diff
6 7 19 17 -2
7 8 24 23 -1

추가 리소스

Pandas: 두 줄의 차이점을 찾는 방법
Pandas: 여러 열을 그룹화하고 집계하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다