كيفية حساب العشريات في بايثون: مع أمثلة
في الإحصاء، العشريات هي أرقام تقسم مجموعة البيانات إلى عشر مجموعات ذات تكرار متساوي.
العشري الأول هو النقطة التي يقل فيها 10٪ من جميع قيم البيانات. العشري الثاني هو النقطة التي تقع فيها 20% من جميع قيم البيانات تحتها، وهكذا.
يمكننا استخدام بناء الجملة التالي لحساب العشريات من مجموعة البيانات في بايثون:
import numpy as np n.p. percentile (var, np. arange (0, 100, 10))
يوضح المثال التالي كيفية استخدام هذه الوظيفة عمليًا.
مثال: حساب العشريات في بايثون
يوضح الكود التالي كيفية إنشاء مجموعة بيانات مزيفة تحتوي على 20 قيمة ثم حساب القيم العشرية لمجموعة البيانات:
import numpy as np
#createdata
data = np. array ([56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99])
#calculate deciles of data
n.p. percentile (data, np. arange (0, 100, 10))
array([56., 63.4, 67.8, 76.5, 83.6, 88.5, 90.4, 92.3, 93.2, 95.2])
طريقة تفسير العشريات هي كما يلي:
- 10% من جميع قيم البيانات أقل من 63.4
- 20% من جميع قيم البيانات أقل من 67.8 .
- 30% من جميع قيم البيانات أقل من 76.5 .
- 40% من جميع قيم البيانات أقل من 83.6 .
- 50% من جميع قيم البيانات أقل من 88.5 .
- 60% من جميع قيم البيانات أقل من 90.4 .
- 70% من جميع قيم البيانات أقل من 92.3 .
- 80% من جميع قيم البيانات أقل من 93.2 .
- 90% من جميع قيم البيانات أقل من 95.2 .
لاحظ أن القيمة الأولى للمخرج (56) تشير ببساطة إلى الحد الأدنى لقيمة مجموعة البيانات.
مثال: وضع القيم في العشريات في بايثون
لوضع كل قيمة بيانات في خانة عشرية، يمكننا استخدام دالة الباندا qcut .
إليك كيفية استخدام هذه الوظيفة لمجموعة البيانات التي أنشأناها في المثال السابق:
import pandas as pd
#create data frame
df = pd. DataFrame ({' values ': [56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99]})
#calculate decile of each value in data frame
df[' Decile '] = pd. qcut (df[' values '], 10, labels= False )
#display data frame
df
values Decile
0 56 0
1 58 0
2 64 1
3 67 1
4 68 2
5 73 2
6 78 3
7 83 3
8 84 4
9 88 4
10 89 5
11 90 5
12 91 6
13 92 6
14 93 7
15 93 7
16 94 8
17 95 8
18 97 9
19 99 9
وطريقة تفسير النتيجة هي كما يلي:
- قيمة البيانات 56 تقع بين النسبة المئوية 0% و10%، لذا فهي في العلامة العشرية 0 .
- قيمة البيانات 58 تقع بين النسبة المئوية 0% و10%، لذا فهي في العلامة العشرية 0 .
- تقع قيمة البيانات 64 بين النسبة المئوية 10% و20%، لذا فهي ضمن الفئة العشرية 1 .
- تقع قيمة البيانات 67 بين النسبة المئوية 10% و20%، لذا تقع في الفئة العشرية 1 .
- تقع قيمة البيانات 68 بين النسبة المئوية 20% و30%، لذا تقع في الفئة العشرية 2 .
وما إلى ذلك وهلم جرا.
مصادر إضافية
كيفية حساب النسب المئوية في بايثون
كيفية حساب المدى الربيعي في بايثون