الباندا: كيفية استخدام description() للمتوسط وstd فقط
يمكنك استخدام الدالة description() لإنشاء إحصائيات وصفية للمتغيرات في pandas DataFrame.
افتراضيًا، تقوم الدالة description() بحساب المقاييس التالية لكل متغير رقمي في DataFrame:
- العد (عدد القيم)
- متوسط (متوسط القيمة)
- ستد (الانحراف المعياري)
- الحد الأدنى (القيمة الدنيا)
- 25% (المئوية الخامسة والعشرون)
- 50% (المئوية الخمسين)
- 75% (المئوية الخامسة والسبعون)
- الحد الأقصى (القيمة القصوى)
ومع ذلك، يمكنك استخدام بناء الجملة التالي لحساب المتوسط والانحراف المعياري لكل متغير رقمي فقط:
df. describe (). loc [[' mean ', ' std ']]
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: استخدم description() في Pandas لحساب المتوسط والمعياري فقط
لنفترض أن لدينا DataFrame الباندا التالية التي تحتوي على معلومات حول مختلف لاعبي كرة السلة:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
إذا استخدمنا الدالة description() ، فيمكننا حساب الإحصائيات الوصفية لكل متغير رقمي في DataFrame:
#calculate descriptive statistics for each numeric variable
df. describe ()
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
25% 14,000000 6,50000 6,000000
50% 18.500000 8.00000 8.500000
75% 20.500000 9.00000 10.250000
max 28.000000 12.00000 12.000000
ومع ذلك، يمكننا استخدام بناء الجملة التالي لحساب المتوسط والانحراف المعياري لكل متغير رقمي:
#only calculate mean and standard deviation of each numeric variable
df. describe (). loc [[' mean ', ' std ']]
points assists rebounds
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
لاحظ أن الإخراج يتضمن فقط المتوسط والانحراف المعياري لكل متغير رقمي.
لاحظ أن الدالة description() لا تزال تحسب كل إحصائية وصفية كما كان من قبل، ولكننا استخدمنا الدالة loc لتحديد الصفوف المسماة mean و std فقط في الإخراج.
ذات صلة: Pandas loc vs iloc: ما الفرق؟
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:
الباندا: كيفية استخدام description() حسب المجموعة
الباندا: كيفية استخدام description() بنسب مئوية محددة
الباندا: كيفية استخدام description() وإزالة التدوين العلمي