Pandas: groupby에서 as_index를 사용하는 방법
pandas groupby() 작업에서 as_index 인수를 사용하여 그룹화한 열을 출력 인덱스로 사용할지 여부를 지정할 수 있습니다.
as_index 인수는 True 또는 False 일 수 있습니다.
기본값은 True 입니다.
다음 예에서는 실제로 as_index 인수를 사용하는 방법을 보여줍니다.
예: pandas groupby에서 as_index를 사용하는 방법
다양한 팀의 농구 선수가 득점한 점수를 보여주는 다음과 같은 팬더 DataFrame이 있다고 가정합니다.
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28]})
#view DataFrame
print (df)
team points
0 to 12
1 to 15
2 to 17
3 to 17
4 to 19
5 B 14
6 B 15
7 C 20
8 C 24
9 C 28
다음 구문을 사용하여 팀 열별로 행을 그룹화하고 포인트 열 합계를 계산할 수 있으며, as_index=True를 지정하여 팀을 출력 인덱스로 사용할 수 있습니다.
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= True ) .sum ())
points
team
At 80
B29
C 72
출력에는 팀 열의 값별로 그룹화된 포인트 열의 값 합계가 표시됩니다.
팀 열은 출력 인덱스로 사용됩니다.
대신 as_index=False를 지정하면 팀 열이 출력 인덱스로 사용되지 않습니다.
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= False ) .sum ())
team points
0 to 80
1 B 29
2 C 72
이제 팀은 출력의 열로 사용되며 인덱스 열의 번호는 단순히 0-2로 지정됩니다.
참고 : 여기에서 pandas groupby() 작업에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas Groupby를 사용한 후 그룹을 얻는 방법
Pandas GroupBy 출력을 DataFrame으로 변환하는 방법
Pandas Groupby에 기능을 적용하는 방법