الباندا: كيفية استخدام description() حسب المجموعة
يمكنك استخدام الدالة description() لإنشاء إحصائيات وصفية للمتغيرات في pandas DataFrame.
يمكنك استخدام بناء الجملة الأساسي التالي لاستخدام الدالة description() مع الدالة groupby() في الباندا:
df. groupby (' group_var ')[' values_var ']. describe ()
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: استخدم description() حسب المجموعة في Pandas
لنفترض أن لدينا DataFrame الباندا التالي الذي يحتوي على معلومات حول لاعبي كرة السلة من فريقين مختلفين:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [8, 12, 14, 14, 15, 22, 27, 24],
' assists ':[2, 2, 3, 5, 7, 6, 8, 12]})
#view DataFrame
print (df)
team points assists
0 to 8 2
1 to 12 2
2 to 14 3
3 to 14 5
4 B 15 7
5 B 22 6
6 B 27 8
7 B 24 12
يمكننا استخدام الدالة description() مع الدالة groupby() لتلخيص القيم الموجودة في عمود النقاط لكل فريق :
#summarize points by team
df. groupby (' team ')[' points ']. describe ()
count mean std min 25% 50% 75% max
team
A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0
B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0
ومن النتيجة يمكننا أن نرى القيم التالية لمتغير النقاط لكل فريق:
- العد (عدد الملاحظات)
- المتوسط (متوسط قيمة النقطة)
- std (الانحراف المعياري لقيم النقاط)
- الحد الأدنى (قيمة النقطة الدنيا)
- 25 % (المئوية الخامسة والعشرون من النقاط)
- 50 % (المئين الخمسين (أي المتوسط) من النقاط)
- 75 % (75% من النقاط)
- الحد الأقصى (قيمة النقطة القصوى)
إذا كنت تريد عرض النتائج بتنسيق DataFrame، فيمكنك استخدام الوسيطة set_index() :
#summarize points by team df. groupby (' team ')[' points ']. describe (). reset_index () team count mean std min 25% 50% 75% max 0 A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0 1 B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0
أصبح متغير الفريق الآن عمودًا في DataFrame وقيم الفهرس هي 0 و1.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:
الباندا: كيفية حساب المجموع التراكمي لكل مجموعة
الباندا: كيفية حساب القيم الفريدة حسب المجموعة
الباندا: كيفية حساب الارتباط حسب المجموعة