الباندا: كيفية استخدام groupby مع مجموعات متعددة


يمكنك استخدام بناء الجملة الأساسي التالي لاستخدام groupby مع مجموعات متعددة في الباندا:

 df. groupby (' team '). agg (
    mean_points=(' points ', np. mean ),
    sum_points=(' points ', np. sum ),
    std_points=(' points ', np. std ))

تقوم هذه الصيغة الخاصة بتجميع صفوف DataFrame حسب المتغير المسمى الفريق ثم تحسب عدة إحصائيات ملخصة للمتغير المسمى النقاط .

يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.

مثال: استخدام Groupby مع مجموعات متعددة في Pandas

لنفترض أن لدينا DataFrame الباندا التالية التي تحتوي على معلومات حول مختلف لاعبي كرة السلة:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat'],
                   ' points ': [18, 22, 19, 14, 14, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9]})

#view DataFrame
print (df)

   team points assists
0 Mavs 18 5
1 Mavs 22 7
2 Mavs 19 7
3 Heat 14 9
4 Heat 14 12
5 Heat 11 9

يمكننا استخدام الصيغة التالية لتجميع صفوف DataFrame حسب الفريق ، ثم حساب المتوسط والمجموع والانحراف المعياري للنقاط لكل فريق:

 import numpy as np

#group by team and calculate mean, sum, and standard deviation of points
df. groupby (' team '). agg (
    mean_points=(' points ', np. mean ),
    sum_points=(' points ', np. sum ),
    std_points=(' points ', np. std ))

      mean_points sum_points std_points
team			
Heat 13.000000 39 1.732051
Mavs 19.666667 59 2.081666

تعرض النتيجة المتوسط والمجموع والانحراف المعياري لمتغير النقاط لكل فريق .

يمكنك استخدام بناء جملة مشابه لإجراء عملية تجميع وحساب العدد الذي تريده من التجميعات.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ مهام الباندا الشائعة الأخرى:

كيفية حساب القيم الفريدة باستخدام Pandas GroupBy
كيفية تطبيق وظيفة على Pandas Groupby
كيفية إنشاء قطعة أرض شريطية من Pandas GroupBy

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *