Pandas: np.where()와 동일한 기능을 사용하는 방법


NumPy Where() 함수를 사용하면 if-else 논리를 사용하여 NumPy 배열의 값을 빠르게 업데이트할 수 있습니다.

예를 들어, 다음 코드는 특정 조건을 충족하는 NumPy 배열의 값을 업데이트하는 방법을 보여줍니다.

 import numpy as np

#create NumPy array of values
x = np. array ([1, 3, 3, 6, 7, 9])

#update valuesin array based on condition
x = np. where ((x < 5) | (x > 8), x/2, x)

#view updated array
x

array([0.5, 1.5, 1.5, 6. , 7. , 4.5])

표의 특정 값이 5보다 작거나 8보다 큰 경우 해당 값을 2로 나눕니다.

그렇지 않으면 값을 변경하지 않고 그대로 둡니다.

pandaswhere() 함수를 사용하여 pandas DataFrame에서 유사한 작업을 수행할 수 있지만 구문은 약간 다릅니다.

NumPywhere() 함수를 사용하는 기본 구문은 다음과 같습니다.

 x = np. where (condition, value_if_true, value_if_false)

pandaswhere() 함수를 사용하는 기본 구문은 다음과 같습니다.

 df[' col '] = (value_if_false). where (condition, value_if_true)

다음 예제에서는 pandaswhere() 함수를 실제로 사용하는 방법을 보여줍니다.

예: Pandas의 np.where()와 동일

다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' B ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print (df)

    AB
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12
5 11 9
6 20 9
7 28 4

다음 pandaswhere() 함수를 사용하여 특정 조건에 따라 A열의 값을 업데이트할 수 있습니다.

 #update values in column A based on condition
df[' A '] = (df[' A '] / 2). where (df[' A '] < 20, df[' A '] * 2)

#view updated DataFrame
print (df)

      AB
0 9.0 5
1 44.0 7
2 9.5 7
3 7.0 9
4 7.0 12
5 5.5 9
6 40.0 9
7 56.0 4

A 열의 특정 값이 20보다 작 으면 해당 값에 2를 곱했습니다.

그렇지 않으면 값을 2로 나눕니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: 조건이 있는 열의 값을 계산하는 방법
Pandas: 조건에 따라 DataFrame에서 행을 삭제하는 방법
Pandas: 조건에 따라 열의 값을 바꾸는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다