Pandalarda yüzdelik sıralama nasıl hesaplanır (örneklerle)
Bir değerin yüzdelik sıralaması bize, sıralaması belirli bir değere eşit veya daha düşük olan bir veri kümesindeki değerlerin yüzdesini anlatır.
Pandalarda yüzdelik sıralamayı hesaplamak için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Sütun için yüzdelik sıralamayı hesaplayın
df[' percent_rank '] = df[' some_column ']. rank (pct= True )
Yöntem 2: Gruba göre yüzdelik sıralamayı hesaplayın
df[' percent_rank '] = df. groupby (' group_var ')[' value_var ']. transform (' rank ', pct= True )
Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A',
'B', 'B', 'B', 'B', 'B', 'B', 'B'],
' points ': [2, 5, 5, 7, 9, 13, 15, 17, 22, 24, 30, 31, 38, 39]})
#view DataFrame
print (df)
team points
0 to 2
1 to 5
2 to 5
3 to 7
4 to 9
5 to 13
6 to 15
7 B 17
8 B 22
9 B 24
10 B 30
11 B 31
12 B 38
13 B 39
Örnek 1: Sütun için yüzdelik sıralamayı hesaplayın
Aşağıdaki kod, puan sütunundaki her bir değerin yüzdelik sırasının nasıl hesaplanacağını gösterir:
#add new column that shows percentile rank of points
df[' percent_rank '] = df[' points ']. rank (pct= True )
#view updated DataFrame
print (df)
team points percent_rank
0 A 2 0.071429
1 to 5 0.178571
2 to 5 0.178571
3 to 7 0.285714
4 to 9 0.357143
5 A 13 0.428571
6 A 15 0.500000
7 B 17 0.571429
8 B 22 0.642857
9 B 24 0.714286
10 B 30 0.785714
11 B 31 0.857143
12 B 38 0.928571
13 B 39 1.000000
Yüzde_sıra sütunundaki değerleri şu şekilde yorumlayabilirsiniz:
- Puan değerlerinin %7,14’ü 2’ye eşit veya küçüktür.
- Puan değerlerinin %17,86’sı 5’e eşit veya küçüktür.
- Puan değerlerinin %28,57’si 7’ye eşit veya küçüktür.
Ve benzeri.
Örnek 2: Gruba göre yüzdelik sıralamayı hesaplama
Aşağıdaki kod, puan sütunundaki her bir değerin takıma göre gruplandırılmış yüzdelik sırasının nasıl hesaplanacağını gösterir:
#add new column that shows percentile rank of points, grouped by team
df[' percent_rank '] = df. groupby (' team ')[' points ']. transform (' rank ', pct= True )
#view updated DataFrame
print (df)
team points percent_rank
0 A 2 0.142857
1 A 5 0.357143
2 A 5 0.357143
3 to 7 0.571429
4 to 9 0.714286
5 A 13 0.857143
6 to 15 1.000000
7 B 17 0.142857
8 B 22 0.285714
9 B 24 0.428571
10 B 30 0.571429
11 B 31 0.714286
12 B 38 0.857143
13 B 39 1.000000
Yüzde_sıra sütunundaki değerleri şu şekilde yorumlayabilirsiniz:
- A takımının puan değerlerinin %14,3’ü 2’ye eşit veya küçüktür.
- A takımının puan değerlerinin %35,7’si 5’e eşit veya küçüktür.
- A takımının puan değerlerinin %57,1’i 7’ye eşit veya küçüktür.
Ve benzeri.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalarda yüzde değişim nasıl hesaplanır
Pandalarda kümülatif yüzde nasıl hesaplanır?
Pandalarda bir grup içindeki toplamın yüzdesi nasıl hesaplanır?