Pandalar: groupby'nin birden fazla toplamayla nasıl kullanılacağı
Pandalarda birden çok toplamayla bir groupby kullanmak için aşağıdaki temel sözdizimini kullanabilirsiniz:
df. groupby (' team '). agg ( mean_points=(' points ', np. mean ), sum_points=(' points ', np. sum ), std_points=(' points ', np. std ))
Bu özel formül, DataFrame’in satırlarını takım adı verilen değişkene göre gruplandırır ve ardından puan adı verilen değişken için çeşitli özet istatistikler hesaplar.
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: Pandalarda Groupby’yi Çoklu Toplamalarla Kullanma
Çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki pandalar DataFrame’e sahip olduğumuzu varsayalım:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat'], ' points ': [18, 22, 19, 14, 14, 11], ' assists ': [5, 7, 7, 9, 12, 9]}) #view DataFrame print (df) team points assists 0 Mavs 18 5 1 Mavs 22 7 2 Mavs 19 7 3 Heat 14 9 4 Heat 14 12 5 Heat 11 9
DataFrame’in satırlarını takıma göre gruplandırmak ve ardından her takım için puanların ortalamasını, toplamını ve standart sapmasını hesaplamak için aşağıdaki sözdizimini kullanabiliriz:
import numpy as np #group by team and calculate mean, sum, and standard deviation of points df. groupby (' team '). agg ( mean_points=(' points ', np. mean ), sum_points=(' points ', np. sum ), std_points=(' points ', np. std )) mean_points sum_points std_points team Heat 13.000000 39 1.732051 Mavs 19.666667 59 2.081666
Sonuç, her takım için puan değişkeninin ortalamasını, toplamını ve standart sapmasını görüntüler.
Bir gruplandırma gerçekleştirmek ve istediğiniz sayıda toplamayı hesaplamak için benzer sözdizimini kullanabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde diğer yaygın panda görevlerinin nasıl gerçekleştirileceği açıklanmaktadır:
Pandas GroupBy kullanılarak benzersiz değerler nasıl sayılır?
Pandas Groupby’ye bir işlev nasıl uygulanır?
Pandas GroupBy’den Bar Grafiği Nasıl Oluşturulur