Pandalar: groupby nesnesindeki sıralama nasıl hesaplanır?
Pandalarda GroupBy nesnesindeki değerlerin sıralamasını hesaplamak için aşağıdaki sözdizimini kullanabilirsiniz:
df[' rank '] = df. groupby ([' group_var '])[' value_var ']. rank ()
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: GroupBy nesnesindeki sıralamayı hesaplama
Farklı takımlardaki basketbol oyuncularının attığı sayıları gösteren aşağıdaki panda DataFrame’e sahip olduğumuzu varsayalım:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
' points ': [10, 10, 12, 15, 19, 23, 20, 20, 26]})
#view DataFrame
print (df)
team points
0 to 10
1 to 10
2 to 12
3 to 15
4 B 19
5 B 23
6 C 20
7 C 20
8 C 26
Her takımın puan değerlerinin sıralamasını hesaplamak için aşağıdaki sözdizimini kullanabiliriz:
#add ranking column to data frame
df[' points_rank '] = df. groupby ([' team '])[' points ']. rank ()
#view updated DataFrame
print (df)
team points points_rank
0 to 10 1.5
1 to 10 1.5
2 to 12 3.0
3 to 15 4.0
4 B 19 1.0
5 B 23 2.0
6 C 20 1.5
7 C 20 1.5
8 C 26 3.0
Varsayılan olarak Rank() işlevi, sıralama değerlerini artan sırada atar ve eşitlik durumunda ortalama sıralamayı kullanır.
Ancak değerleri farklı bir şekilde sıralamak için aşağıdan yukarıya yöntemini ve argümanları kullanabiliriz:
#add ranking column to data frame
df[' points_rank '] = df. groupby ([' team '])[' points ']. rank (' dense ', ascending= False )
#view updated DataFrame
print (df)
team points points_rank
0 to 10 3.0
1 to 10 3.0
2 to 12 2.0
3 to 15 1.0
4 B 19 2.0
5 B 23 1.0
6 C 20 2.0
7 C 20 2.0
8 C 26 1.0
Bu yöntem, her gruptaki en büyük değere 1 değerini atar.
Rank() işleviyle kullanabileceğiniz sıralama yöntemlerinin tam listesini burada bulabilirsiniz.
Not : Pandalarda GroupBy işleminin tam belgelerini burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalar: Grup başına kümülatif toplam nasıl hesaplanır?
Pandalar: benzersiz değerlerin gruba göre nasıl sayılacağı
Pandalar: gruba göre korelasyon nasıl hesaplanır