Pandas: 두 열의 차이점을 찾는 방법
Pandas DataFrame에서 두 열 간의 차이점을 찾으려면 다음 구문을 사용할 수 있습니다.
df[' difference '] = df[' column1 '] - df[' column2 ']
다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.
예 1: 두 열 간의 차이 찾기
8개의 연속 판매 기간 동안 두 지역(A 및 B)의 총 매출을 표시하는 다음과 같은 pandas DataFrame이 있다고 가정합니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' period ': [1, 2, 3, 4, 5, 6, 7, 8], ' A_sales ': [12, 14, 15, 13, 18, 20, 19, 24], ' B_sales ': [14, 19, 20, 22, 24, 20, 17, 23]}) #view DataFrame df period A_sales B_sales 0 1 12 14 1 2 14 19 2 3 15 20 3 4 13 22 4 5 18 24 5 6 20 20 6 7 19 17 7 8 24 23
다음 코드는 각 판매 기간에 대해 B 지역과 A 지역의 매출 차이를 계산하는 방법을 보여줍니다.
#add new column to represent difference between B sales and A sales df[' diff '] = df[' B_sales '] - df[' A_sales '] #view DataFrame df period A_sales B_sales diff 0 1 12 14 2 1 2 14 19 5 2 3 15 20 5 3 4 13 22 9 4 5 18 24 6 5 6 20 20 0 6 7 19 17 -2 7 8 24 23 -1
pandas.Series.abs() 함수를 사용하여 매출의 절대 차이를 계산할 수도 있습니다.
#add new column to represent absolute difference between B sales and A sales df[' diff '] = pd. Series . abs (df[' B_sales '] - df[' A_sales ']) #view DataFrame df period A_sales B_sales diff 0 1 12 14 2 1 2 14 19 5 2 3 15 20 5 3 4 13 22 9 4 5 18 24 6 5 6 20 20 0 6 7 19 17 2 7 8 24 23 1
예시 2: 조건에 따라 열 간의 차이 찾기
또한 DataFrame을 필터링하여 열 간의 차이가 특정 값보다 작거나 큰 행만 표시할 수도 있습니다.
예를 들어, 다음 코드는 A 지역의 매출이 B 지역의 매출보다 큰 행만 반환합니다.
#add new column to represent difference between B sales and A sales df[' diff '] = df[' B_sales '] - df[' A_sales '] #display rows where sales in region A is greater than sales in region B df[df[' diff ']< 0 ] period A_sales B_sales diff 6 7 19 17 -2 7 8 24 23 -1