الباندا: كيفية استخدام description() بنسب مئوية محددة


يمكنك استخدام الدالة description() لإنشاء إحصائيات وصفية للمتغيرات في pandas DataFrame.

افتراضيًا، تقوم الباندا بحساب النسب المئوية 25 و50 و75 للمتغيرات.

ومع ذلك، يمكنك استخدام وسيطة النسب المئوية في الدالة description() لتحديد النسب المئوية الدقيقة المطلوب حسابها.

توضح الأمثلة التالية كيفية استخدام هذه الوسيطة عمليًا مع الباندا DataFrame التالية:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

مثال 1: استخدام description() مع النسب المئوية الافتراضية

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة description() لحساب الإحصائيات الوصفية لكل متغير رقمي في DataFrame:

 #calculate descriptive statistics for each numeric variable
df. describe ()

points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
25% 14,000000 6,50000 6,000000
50% 18.500000 8.00000 8.500000
75% 20.500000 9.00000 10.250000
max 28.000000 12.00000 12.000000

لاحظ أن الدالة description() تحسب النسب المئوية 25 و50 و75 لكل متغير بشكل افتراضي.

مثال 2: استخدام description() مع النسب المئوية المخصصة

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة description() مع الوسيطة المئوية لحساب النسب المئوية 30 و60 و90 لكل متغير رقمي في DataFrame:

 #calculate custom percentiles for each numeric variable
df. describe (percentiles=[ .3 , .6 , .9 ])

           points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
30% 14.400000 7.00000 6.200000
50% 18.500000 8.00000 8.500000
60% 19.200000 9.00000 9.200000
90% 23.800000 9.90000 11.300000
max 28.000000 12.00000 12.000000

لاحظ أن الدالة description() تُرجع النسب المئوية 30 و60 و90 لكل متغير رقمي.

ملاحظة : تقوم الدالة description() أيضًا بإرجاع النسبة المئوية الخمسين لأن هذا يمثل القيمة المتوسطة لكل متغير وهو أحد المقاييس الافتراضية التي يتم حسابها بواسطة الدالة description() .

مثال 3: استخدام description() بدون نسبة مئوية

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة description() مع الوسيطة المئوية=[] لحساب عدم وجود نسب مئوية لكل متغير رقمي في DataFrame:

 #calculate no percentiles for each numeric variable
df. describe (percentiles=[])

           points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
50% 18.500000 8.00000 8.500000
max 28.000000 12.00000 12.000000

لاحظ أن المئين 25 و75 لم يعد يتم حسابهما لكل متغير.

لاحظ أن النسبة المئوية الخمسين يتم تضمينها دائمًا في النتيجة لأنها تمثل القيمة المتوسطة لكل متغير.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:

الباندا: كيفية استخدام description() حسب المجموعة
الباندا: كيفية استخدام description() وإزالة التدوين العلمي
الباندا: كيفية حساب المتوسط والوسيط والمنوال

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *