Pandas:두 값 사이에서 행을 선택하는 방법
다음 기본 구문을 사용하여 열이 두 개의 특정 값 사이에 있는 Pandas DataFrame에서 행을 선택할 수 있습니다.
df_filtered = df[df[' points ']. between ( 25 , 35 )]
이 특정 예에서는 포인트 열의 값이 25에서 35 사이인 모든 행을 선택합니다.
대신 포인트 열의 값이 25에서 35 사이가 아닌 행을 선택하려면 열 이름 앞에 물결표( ~ )를 추가하면 됩니다.
df_filtered = df[ ~ df[' points ']. between ( 25 , 35 )]
다음 예에서는 각 방법을 실제로 사용하는 방법을 보여줍니다.
예: Pandas에서 두 값 사이의 행 선택
다양한 팀의 농구 선수가 득점한 점수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Nets', 'Nets', 'Heat', 'Heat', 'Kings'], ' points ': [22, 28, 35, 34, 29, 28, 23]}) #view DataFrame print (df) team points 0 Mavs 22 1 Mavs 28 2 Nets 35 3 Nets 34 4 Heat 29 5 Heat 28 6 Kings 23
다음 구문을 사용하여 포인트 열의 값이 25에서 35 사이인 DataFrame의 행만 선택할 수 있습니다.
#select rows where value in points column is between 25 and 35
df_filtered = df[df[' points ']. between ( 25 , 35 )]
#view filtered DataFrame
print (df_filtered)
team points
1 Mavs 28
2 Nets 35
3 Nets 34
4 Heat 29
5 Heat 28
포인트 열의 값이 25~35 사이인 행만 선택되었습니다.
between() 함수에는 하한과 상한의 값이 포함되어 있습니다 .
예를 들어 포인트 값이 35인 플레이어가 필터링된 DataFrame에 포함되었습니다.
포인트 열의 값이 25에서 35 사이가 아닌 행만 선택하려면 열 이름 앞에 물결표( ~ )를 추가하면 됩니다.
#select rows where value in points column is not between 25 and 35
df_filtered = df[ ~ df[' points ']. between ( 25 , 35 )]
#view filtered DataFrame
print (df_filtered)
team points
0 Mavs 22
6 Kings 23
포인트 열의 값이 25에서 35 사이가 아닌 행만 선택되었습니다.
참고 : 여기에서 pandas between() 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
팬더: 두 열이 동일한 행 선택
Pandas: 부울 계열을 사용하여 DataFrame에서 행 선택
Pandas: NaN 값이 있는 행 선택