الباندا: كيفية استخدام groupby مع مجموعات متعددة
يمكنك استخدام بناء الجملة الأساسي التالي لاستخدام groupby مع مجموعات متعددة في الباندا:
df. groupby (' team '). agg ( mean_points=(' points ', np. mean ), sum_points=(' points ', np. sum ), std_points=(' points ', np. std ))
تقوم هذه الصيغة الخاصة بتجميع صفوف DataFrame حسب المتغير المسمى الفريق ثم تحسب عدة إحصائيات ملخصة للمتغير المسمى النقاط .
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: استخدام Groupby مع مجموعات متعددة في Pandas
لنفترض أن لدينا DataFrame الباندا التالية التي تحتوي على معلومات حول مختلف لاعبي كرة السلة:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat'], ' points ': [18, 22, 19, 14, 14, 11], ' assists ': [5, 7, 7, 9, 12, 9]}) #view DataFrame print (df) team points assists 0 Mavs 18 5 1 Mavs 22 7 2 Mavs 19 7 3 Heat 14 9 4 Heat 14 12 5 Heat 11 9
يمكننا استخدام الصيغة التالية لتجميع صفوف DataFrame حسب الفريق ، ثم حساب المتوسط والمجموع والانحراف المعياري للنقاط لكل فريق:
import numpy as np #group by team and calculate mean, sum, and standard deviation of points df. groupby (' team '). agg ( mean_points=(' points ', np. mean ), sum_points=(' points ', np. sum ), std_points=(' points ', np. std )) mean_points sum_points std_points team Heat 13.000000 39 1.732051 Mavs 19.666667 59 2.081666
تعرض النتيجة المتوسط والمجموع والانحراف المعياري لمتغير النقاط لكل فريق .
يمكنك استخدام بناء جملة مشابه لإجراء عملية تجميع وحساب العدد الذي تريده من التجميعات.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ مهام الباندا الشائعة الأخرى:
كيفية حساب القيم الفريدة باستخدام Pandas GroupBy
كيفية تطبيق وظيفة على Pandas Groupby
كيفية إنشاء قطعة أرض شريطية من Pandas GroupBy