Pandas: groupby에서 as_index를 사용하는 방법


pandas groupby() 작업에서 as_index 인수를 사용하여 그룹화한 열을 출력 인덱스로 사용할지 여부를 지정할 수 있습니다.

as_index 인수는 True 또는 False 일 수 있습니다.

기본값은 True 입니다.

다음 예에서는 실제로 as_index 인수를 사용하는 방법을 보여줍니다.

예: pandas groupby에서 as_index를 사용하는 방법

다양한 팀의 농구 선수가 득점한 점수를 보여주는 다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28]})
                            
#view DataFrame
print (df)

  team points
0 to 12
1 to 15
2 to 17
3 to 17
4 to 19
5 B 14
6 B 15
7 C 20
8 C 24
9 C 28

다음 구문을 사용하여 열별로 행을 그룹화하고 포인트 열 합계를 계산할 수 있으며, as_index=True를 지정하여 팀을 출력 인덱스로 사용할 수 있습니다.

 #group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= True ) .sum ())

points
team        
At 80
B29
C 72

출력에는 열의 값별로 그룹화된 포인트 열의 값 합계가 표시됩니다.

열은 출력 인덱스로 사용됩니다.

대신 as_index=False를 지정하면 열이 출력 인덱스로 사용되지 않습니다.

 #group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= False ) .sum ())

  team points
0 to 80
1 B 29
2 C 72

이제 팀은 출력의 열로 사용되며 인덱스 열의 번호는 단순히 0-2로 지정됩니다.

참고 : 여기에서 pandas groupby() 작업에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas Groupby를 사용한 후 그룹을 얻는 방법
Pandas GroupBy 출력을 DataFrame으로 변환하는 방법
Pandas Groupby에 기능을 적용하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다