Pandas: як використовувати as_index у groupby
Ви можете використовувати аргумент as_index в операції pandas groupby() , щоб вказати, чи потрібно використовувати стовпець, за яким ви згрупували, як індекс результату.
Аргумент as_index може мати значення True або False .
Типовим значенням є True .
У наступному прикладі показано, як використовувати аргумент as_index на практиці.
Приклад: як використовувати as_index у pandas groupby
Припустимо, що у нас є такий Frame DataFrame pandas, який показує кількість очок, набраних баскетболістами різних команд:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28]})
#view DataFrame
print (df)
team points
0 to 12
1 to 15
2 to 17
3 to 17
4 to 19
5 B 14
6 B 15
7 C 20
8 C 24
9 C 28
Ми можемо використати наступний синтаксис, щоб згрупувати рядки за стовпцем team і обчислити суму стовпця балів , вказавши as_index=True для використання team як вихідного індексу:
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= True ) .sum ())
points
team
At 80
B29
C 72
На виході відображається сума значень у стовпці балів , згрупована за значеннями в стовпці команди .
Зауважте, що стовпець team використовується як індекс результату.
Якщо натомість ми вкажемо as_index=False , стовпець команди не використовуватиметься як вихідний індекс:
#group rows by team and calculate sum of points
print ( df.groupby (' team ', as_index= False ) .sum ())
team points
0 to 80
1 B 29
2 C 72
Зверніть увагу, що team тепер використовується як стовпець у виводі, а стовпець індексу просто пронумерований 0-2.
Примітка . Ви можете знайти повну документацію щодо операції pandas groupby() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:
Як отримати групу після використання Pandas Groupby
Як перетворити вихід Pandas GroupBy на DataFrame
Як застосувати функцію до Pandas Groupby