الباندا: كيفية استخدام description() وإزالة التدوين العلمي
يمكنك استخدام الدالة description() لإنشاء إحصائيات وصفية للمتغيرات في pandas DataFrame.
لإزالة التدوين العلمي من مخرجات الدالة description() ، يمكنك استخدام الطرق التالية:
الطريقة الأولى: إزالة التدوين العلمي عند استخدام description() مع عمود
df[' my_column ']. describe (). apply ( lambda x: format (x, ' f '))
الطريقة الثانية: إزالة التدوين العلمي عند استخدام description() مع أعمدة متعددة
df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))
توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع الباندا DataFrame التالية:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' sales ': [8450550, 406530, 53000, 6000, 2000, 4000, 5400, 6500],
' returns ':[2212200, 145200, 300, 2500, 700, 600, 800, 1200]})
#view DataFrame
print (df)
store sales returns
0 A 8450550 2212200
1 A 406530 145200
2 A 53000 300
3 A 6000 2500
4 B 2000 700
5 B 4000 600
6 B 5400 800
7 B 6500 1200
مثال 1: قم بإزالة التدوين العلمي عند استخدام description() مع عمود
إذا استخدمنا الدالة description() لحساب الإحصائيات الوصفية لعمود المبيعات ، فسيتم عرض قيم المخرجات بالترميز العلمي:
#calculate descriptive statistics for sales column
df[' sales ']. describe ()
count 8.000000e+00
mean 1.116748e+06
std 2.966552e+06
min 2.000000e+03
25% 5.050000e+03
50% 6.250000e+03
75% 1.413825e+05
max 8.450550e+06
Name: sales, dtype: float64
لاحظ أنه يتم عرض كل من قيم الإخراج باستخدام التدوين العلمي.
يمكننا استخدام الصيغة التالية لإزالة التدوين العلمي من الإخراج:
#calculate descriptive statistics for sales column and suppress scientific notation
df[' sales ']. describe (). apply ( lambda x: format (x, ' f '))
count 8.000000
mean 1116747.500000
std 2966551.594104
min 2000.000000
25% 5050.000000
50% 6250.000000
75% 141382.500000
max 8450550.000000
Name: sales, dtype: object
لاحظ أن القيم الموجودة في الإخراج يتم عرضها الآن بدون تدوين علمي.
مثال 2: إزالة الترميز العلمي عند استخدام description() مع أعمدة متعددة
إذا استخدمنا الدالة description() لحساب الإحصائيات الوصفية لكل عمود رقمي، فسيتم عرض قيم الإخراج بالترميز العلمي:
#calculate descriptive statistics for each numeric column
df. describe ()
sales returns
count 8.000000e+00 8.000000e+00
mean 1.116748e+06 2.954375e+05
std 2.966552e+06 7.761309e+05
min 2.000000e+03 3.000000e+02
25% 5.050000e+03 6.750000e+02
50% 6.250000e+03 1.000000e+03
75% 1.413825e+05 3.817500e+04
max 8.450550e+06 2.212200e+06
لاحظ أنه يتم عرض كل من قيم الإخراج باستخدام التدوين العلمي.
يمكننا استخدام الصيغة التالية لإزالة التدوين العلمي من الإخراج:
#calculate descriptive statistics for numerical columns and suppress scientific notation
df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))
sales returns
count 8.00000 8.00000
mean 1116747.50000 295437.50000
std 2966551.59410 776130.93692
min 2000.00000 300.00000
25% 5050.00000 675.00000
50% 6250.00000 1000.00000
75% 141382.50000 38175.00000
max 8450550.00000 2212200.00000
لاحظ أن القيم الموجودة في الإخراج يتم عرضها الآن بدون تدوين علمي.
لاحظ أننا في هذا المثال استخدمنا 0:.5f لعرض 5 منازل عشرية في الإخراج.
لا تتردد في استبدال الرقم 5 برقم مختلف لعرض عدد مختلف من المنازل العشرية.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في الباندا:
الباندا: كيفية حساب المجموع التراكمي لكل مجموعة
الباندا: كيفية حساب القيم الفريدة حسب المجموعة
الباندا: كيفية حساب الارتباط حسب المجموعة