كيفية حساب النسب المئوية في بايثون: مع الأمثلة
النسبة المئوية n لمجموعة البيانات هي القيمة التي تقطع النسبة المئوية العليا لقيم البيانات عند فرز جميع القيم من الأصغر إلى الأكبر.
على سبيل المثال، النسبة المئوية التسعون لمجموعة البيانات هي القيمة التي تفصل 90% من قيم البيانات عن أعلى 10% من قيم البيانات.
يمكننا حساب النسب المئوية بسرعة في بايثون باستخدام الدالة numpy.percentile() ، والتي تستخدم الصيغة التالية:
numpy.percentile(أ، ف)
ذهب:
- أ: جدول القيم
- س: النسبة المئوية أو تسلسل النسب المئوية المطلوب حسابها، والتي يجب أن تتراوح بين 0 و100 ضمناً.
يشرح هذا البرنامج التعليمي كيفية استخدام هذه الوظيفة لحساب النسب المئوية في بايثون.
كيفية العثور على النسب المئوية للجدول
يوضح التعليمة البرمجية التالية كيفية العثور على نسب مئوية مختلفة لمصفوفة معينة في بايثون:
import numpy as np #make this example reproducible n.p. random . seeds (0) #create array of 100 random integers distributed between 0 and 500 data = np. random . randint (0, 500, 100) #find the 37th percentile of the array n.p. percentile (data, 37) 173.26 #Find the quartiles (25th, 50th, and 75th percentiles) of the array n.p. percentile (data, [25, 50, 75]) array([116.5, 243.5, 371.5])
كيفية العثور على النسب المئوية لعمود DataFrame
يوضح التعليمة البرمجية التالية كيفية العثور على القيمة المئوية 95 لعمود DataFrame واحد من الباندا:
import numpy as np
import pandas as pd
#createDataFrame
df = pd.DataFrame({'var1': [25, 12, 15, 14, 19, 23, 25, 29, 33, 35],
'var2': [5, 7, 7, 9, 12, 9, 9, 4, 14, 15],
'var3': [11, 8, 10, 6, 6, 5, 9, 12, 13, 16]})
#find 90th percentile of var1 column
n.p. percentile (df. var1 , 95)
34.1
كيفية العثور على النسب المئوية لأعمدة DataFrame المتعددة
يوضح التعليمة البرمجية التالية كيفية العثور على القيمة المئوية 95 لأعمدة متعددة في pandas DataFrame:
import numpy as np
import pandas as pd
#createDataFrame
df = pd.DataFrame({'var1': [25, 12, 15, 14, 19, 23, 25, 29, 33, 35],
'var2': [5, 7, 7, 9, 12, 9, 9, 4, 14, 15],
'var3': [11, 8, 10, 6, 6, 5, 9, 12, 13, 16]})
#find 95th percentile of each column
df. quantile (.95)
var1 34.10
var2 14.55
var3 14.65
#find 95th percentile of just columns var1 and var2
df[[' var1 ', ' var2 ']]. quantile (.95)
var1 34.10
var2 14.55
لاحظ أننا كنا قادرين على استخدام الدالة pandas quantile() في الأمثلة أعلاه لحساب النسب المئوية.