Pandalar: dizine göre nasıl gruplandırılır ve hesaplama yapılır
Pandalarda bir veya daha fazla dizin sütununu gruplamak ve hesaplamalar yapmak için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Dizin sütununa göre gruplandırma
df. groupby (' index1 ')[' numeric_column ']. max ()
Yöntem 2: Birden çok dizin sütununa göre gruplandırma
df. groupby ([' index1 ',' index2 '])[' numeric_column ']. sum ()
Yöntem 3: Dizin Sütununa ve Normal Sütuna Göre Gruplandırma
df. groupby ([' index1 ',' numeric_column1 '])[' numeric_column2 ']. nunique ()
Aşağıdaki örnekler, her yöntemin MultiIndex’e sahip aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
' position ': ['G', 'G', 'G', 'F', 'F', 'G', 'G', 'F', 'F', 'F'],
' points ': [7, 7, 7, 19, 16, 9, 10, 10, 8, 8],
' rebounds ': [8, 8, 8, 10, 11, 12, 13, 13, 15, 11]})
#set 'team' column to be index column
df. set_index ([' team ', ' position '], inplace= True )
#view DataFrame
df
rebound points
team position
A G 7 8
G 7 8
G 7 8
F 19 10
F 16 11
B G 9 12
G 10 13
F 10 13
F 8 15
F 8 11
Yöntem 1: Dizin sütununa göre gruplandırma
Aşağıdaki kod, “konum” dizin sütununa göre gruplandırılmış “puan” sütununun maksimum değerinin nasıl bulunacağını gösterir:
#find max value of 'points' grouped by 'position index column
df. groupby (' position ')[' points ']. max ()
position
F 19
G 10
Name: points, dtype: int64
Yöntem 2: Birden çok dizin sütununa göre gruplandırma
Aşağıdaki kod, “takım” ve “pozisyon” dizin sütunlarına göre gruplandırılmış “puan” sütununun toplamının nasıl bulunacağını gösterir:
#find max value of 'points' grouped by 'position index column
df. groupby ([' team ', ' position '])[' points ']. sum ()
team position
AF35
G21
BF 26
G 19
Name: points, dtype: int64
Yöntem 3: Dizin Sütununa ve Normal Sütuna Göre Gruplandırma
Aşağıdaki kod, “takım” indeks sütunu ve normal “puan” sütununa göre gruplandırılmış “ribaund” sütunundaki benzersiz değerlerin sayısının nasıl bulunacağını gösterir:
#find max value of 'points' grouped by 'position index column
df. groupby ([' team ', ' points '])[' rebounds ']. nunique ()
team points
At 7 1
16 1
19 1
B 8 2
9 1
10 1
Name: rebounds, dtype: int64
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalarda benzersiz değerler nasıl sayılır?
Pandalarda MultiIndex nasıl düzleştirilir
Pandalar’da bir veya daha fazla indeks değeri nasıl değiştirilir?
Pandalar’da bir dizin nasıl sıfırlanır