Pandas:두 값 사이에서 행을 선택하는 방법


다음 기본 구문을 사용하여 열이 두 개의 특정 값 사이에 있는 Pandas DataFrame에서 행을 선택할 수 있습니다.

 df_filtered = df[df[' points ']. between ( 25 , 35 )]

이 특정 예에서는 포인트 열의 값이 25에서 35 사이인 모든 행을 선택합니다.

대신 포인트 열의 값이 25에서 35 사이가 아닌 행을 선택하려면 열 이름 앞에 물결표( ~ )를 추가하면 됩니다.

 df_filtered = df[ ~ df[' points ']. between ( 25 , 35 )]

다음 예에서는 각 방법을 실제로 사용하는 방법을 보여줍니다.

예: Pandas에서 두 값 사이의 행 선택

다양한 팀의 농구 선수가 득점한 점수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Nets', 'Nets', 'Heat', 'Heat', 'Kings'],
                   ' points ': [22, 28, 35, 34, 29, 28, 23]})

#view DataFrame
print (df)

    team points
0 Mavs 22
1 Mavs 28
2 Nets 35
3 Nets 34
4 Heat 29
5 Heat 28
6 Kings 23

다음 구문을 사용하여 포인트 열의 값이 25에서 35 사이인 DataFrame의 행만 선택할 수 있습니다.

 #select rows where value in points column is between 25 and 35
df_filtered = df[df[' points ']. between ( 25 , 35 )]

#view filtered DataFrame
print (df_filtered)

   team points
1 Mavs 28
2 Nets 35
3 Nets 34
4 Heat 29
5 Heat 28

포인트 열의 값이 25~35 사이인 행만 선택되었습니다.

between() 함수에는 하한과 상한의 값이 포함되어 있습니다 .

예를 들어 포인트 값이 35인 플레이어가 필터링된 DataFrame에 포함되었습니다.

포인트 열의 값이 25에서 35 사이가 아닌 행만 선택하려면 열 이름 앞에 물결표( ~ )를 추가하면 됩니다.

 #select rows where value in points column is not between 25 and 35
df_filtered = df[ ~ df[' points ']. between ( 25 , 35 )]

#view filtered DataFrame
print (df_filtered)

    team points
0 Mavs 22
6 Kings 23

포인트 열의 값이 25에서 35 사이가 아닌 행만 선택되었습니다.

참고 : 여기에서 pandas between() 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

팬더: 두 열이 동일한 행 선택
Pandas: 부울 계열을 사용하여 DataFrame에서 행 선택
Pandas: NaN 값이 있는 행 선택

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다