Pandalar: groupby işlevindeki sütunlar nasıl yeniden adlandırılır?


Pandalarda groupby() işlevindeki sütunları yeniden adlandırmak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df. groupby (' group_col '). agg (sum_col1=(' col1 ', ' sum '),
                            mean_col2=(' col2 ', ' mean '),
                            max_col3=(' col3 ', ' max '))

Bu özel örnek, üç toplam sütunu hesaplar ve bunları sum_col1 , Mean_col2 ve max_col3 olarak adlandırır.

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Pandalar’daki Groupby işlevindeki sütunları yeniden adlandırın

Aşağıdaki pandalara sahip olduğumuzu varsayalım DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [30, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 6, 6, 5, 8, 7, 7, 9],
                   ' rebounds ': [4, 13, 15, 10, 7, 7, 5, 11]})

#view DataFrame
print (df)

  team points assists rebounds
0 to 30 5 4
1 to 22 6 13
2 A 19 6 15
3 A 14 5 10
4 B 14 8 7
5 B 11 7 7
6 B 20 7 5
7 B 28 9 11

Satırları ekip sütununa göre gruplamak ve ardından toplu sütunlar için belirli adlar sağlarken üç toplam sütunu hesaplamak için aşağıdaki sözdizimini kullanabiliriz:

 #calculate several aggregated columns by group and rename aggregated columns
df. groupby (' team '). agg (sum_points=(' points ', ' sum '),
                       mean_assists=(' assists ', ' mean '),
                       max_rebounds=(' rebounds ', ' max '))

	sum_points mean_assists max_rebounds
team			
A 85 5.50 15
B 73 7.75 11

Birleştirilmiş üç sütunun, agg() işlevinde sağladığımız özel adlara sahip olduğunu unutmayın.

Ayrıca istersek agg() fonksiyonundaki toplam, ortalama ve maksimum değerleri hesaplamak için NumPy fonksiyonlarını kullanabileceğimizi de unutmayın.

 import numpy as np

#calculate several aggregated columns by group and rename aggregated columns
df. groupby (' team '). agg (sum_points=(' points ', np. sum ),
                       mean_assists=(' assists ', np. mean ),
                       max_rebounds=(' rebounds ', np. max ))

	sum_points mean_assists max_rebounds
team			
A 85 5.50 15
B 73 7.75 11

Bu sonuçlar önceki örneğin sonuçlarına karşılık gelir.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda tüm sütun adları nasıl listelenir?
Pandalar’da sütunlar ada göre nasıl sıralanır
Pandalar’da yinelenen sütunlar nasıl kaldırılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir