Pandas: 그룹별로 처음 n 행을 얻는 방법


다음 기본 구문을 사용하여 Pandas DataFrame에서 그룹별로 처음 N 행을 가져올 수 있습니다.

 df. groupby (' group_column '). head ( 2 ). reset_index (drop= True )

이 특정 구문은 그룹당 처음 2 줄을 반환합니다.

다른 수의 상위 행을 반환하려면 head() 함수의 값을 변경하기만 하면 됩니다.

다음 예에서는 다음 Pandas DataFrame에서 이 구문을 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'F', 'G', 'G', 'F', 'F', 'F'],
                   ' points ': [5, 7, 7, 9, 12, 9, 9, 4, 7, 7]})

#view DataFrame
print (df)

  team position points
0 AG 5
1 AG 7
2 AG 7
3 AF 9
4AF 12
5 BG 9
6 BG 9
7 BF 4
8 BF 7
9 BF 7

예 1: 열로 그룹화된 처음 N 행 가져오기

다음 코드는 변수로 그룹화된 처음 2개 행을 반환하는 방법을 보여줍니다.

 #get top 2 rows grouped by team
df. groupby (' team '). head ( 2 ). reset_index (drop= True )

        team position points
0 A G 5
1 A G 7
2 B G 9
3 B G 9

출력에는 변수별로 그룹화된 처음 2줄이 표시됩니다.

예 2: 여러 열로 그룹화된 처음 N 행 가져오기

다음 코드는 위치 변수별로 그룹화된 처음 2개 행을 반환하는 방법을 보여줍니다.

 #get top 2 rows grouped by team and position
df. groupby ([' team ', ' position ']). head ( 2 ). reset_index (drop= True )

team position points
0 A G 5
1 A G 7
2 A F 9
3 A F 12
4 B G 9
5 B G 9
6 B F 4
7 B F 7

출력에는 위치 변수별로 그룹화된 처음 2줄이 표시됩니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: 열에서 고유한 값을 찾는 방법
Pandas: 여러 열에서 고유한 값을 찾는 방법
Pandas: 열에서 특정 값의 발생 횟수를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다