Pandalar'da gruplara göre nicelikler nasıl hesaplanır?


Pandas’ta yüzdelik dilimleri gruba göre hesaplamak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df. groupby (' grouping_variable '). quantile ( .5 )

Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: gruba göre yüzdelik değeri hesaplayın

Aşağıdaki pandalara sahip olduğumuzu varsayalım DataFrame:

 import pandas as pd

#createDataFrame 
df = pd. DataFrame ({' team ': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
                   ' score ': [3, 4, 4, 5, 5, 8, 1, 2, 2, 3, 3, 5]})

#view first five rows
df. head ()

team score
0 1 3
1 1 4
2 1 4
3 1 5
4 1 5 

Aşağıdaki kod, “takım” sütununa göre gruplandırılmış “puan” sütunundaki değerlerin 90. yüzdelik diliminin nasıl hesaplanacağını gösterir:

 df. groupby (' team '). quantile ( .90 )

	score
team	
1 6.5
2 4.0

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

  • Takım 1 için “puanların” 90’ıncı yüzdelik dilimi 6,5’tir .
  • Takım 2 için “puanların” 90. yüzdelik dilimi 4,0’dır .

Örnek 2: Grup başına birden fazla yüzdelik dilimin hesaplanması

Aşağıdaki kod, grup başına birden fazla yüzdelik dilimin aynı anda nasıl hesaplanacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
                   ' score ': [3, 4, 4, 5, 5, 8, 1, 2, 2, 3, 3, 5]})

#create functions to calculate 1st and 3rd quartiles
def q1(x):
    return x. quantile ( 0.25 )

def q3(x):
    return x. quantile ( 0.75 )

#calculate 1st and 3rd quartiles by group
vals = {' score ': [q1, q3]}

df. groupby (' team '). agg (vals)

	score
        q1 q3
team		
1 4.0 5.0
2 2.0 3.0

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

  • Takım 1’in puanlarının birinci ve üçüncü çeyreği sırasıyla 4,0 ve 5,0’dır .
  • Takım 2’nin skorlarının birinci ve üçüncü çeyreği sırasıyla 2,0 ve 3,0’dır .

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalar’da grup başına maksimum değer nasıl bulunur?
Pandalarda grup görülmeleri nasıl sayılır?
Pandalar’daki sütunların ortalaması nasıl hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir