الباندا: كيفية استخدام description() للمتغيرات الفئوية


افتراضيًا، تقوم الدالة description() في الباندا بحساب الإحصائيات الوصفية لجميع المتغيرات الرقمية في DataFrame.

ومع ذلك، يمكنك أيضًا استخدام الطرق التالية لحساب الإحصائيات الوصفية للمتغيرات الفئوية :

الطريقة الأولى: حساب الإحصائيات الوصفية للمتغيرات الفئوية

 df. describe (include=' object ')

ستقوم هذه الطريقة بحساب العدد والفريد والأعلى والتكرار لكل متغير فئوي في DataFrame.

الطريقة الثانية: حساب الإحصائيات الوصفية الفئوية لجميع المتغيرات

 df. astype (' object '). describe ()

ستقوم هذه الطريقة بحساب العدد والفريد والأعلى والتكرار لكل متغير في DataFrame.

توضح الأمثلة التالية كيفية استخدام كل طريقة مع الباندا التالية DataFrame التي تحتوي على معلومات حول لاعبي كرة السلة المختلفين:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

المثال 1: حساب الإحصائيات الوصفية للمتغيرات الفئوية

يمكننا استخدام بناء الجملة التالي لحساب الإحصائيات الوصفية لكل متغير فئوي في DataFrame:

 #calculate descriptive statistics for categorical variables only
df. describe (include=' object ')

team
count 8
single 8
top A
freq 1

يعرض الإخراج إحصائيات وصفية متنوعة للمتغير الفئوي الفردي ( الفريق ) في DataFrame.

وإليك كيفية تفسير النتيجة:

  • العد : هناك 8 قيم في عمود الفريق.
  • فريدة : هناك 8 قيم فريدة في عمود الفريق.
  • top : القيمة “الأعلى” (أي الأعلى في الأبجدية) هي A.
  • التكرار : تظهر هذه القيمة القصوى مرة واحدة.

مثال 2: حساب الإحصائيات الوصفية الفئوية لجميع المتغيرات

يمكننا استخدام الصيغة التالية لحساب العد والفريد والأعلى والتكرار لكل متغير في DataFrame:

 #calculate categorical descriptive statistics for all variables
df. astype (' object '). describe ()

        team points assists rebounds
count 8 8 8 8
single 8 7 5 7
top A 14 9 6
freq 1 2 3 2

يعرض الإخراج العدد والفريد والأعلى والتكرار لكل متغير في DataFrame، بما في ذلك المتغيرات الرقمية.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:

الباندا: كيفية استخدام description() حسب المجموعة
الباندا: كيفية استخدام description() بنسب مئوية محددة
الباندا: كيفية استخدام description() وإزالة التدوين العلمي

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *