كيفية حساب الأعشار في r (مع أمثلة)


في الإحصاء، العشريات هي أرقام تقسم مجموعة البيانات إلى عشر مجموعات ذات تكرار متساوي.

العشري الأول هو النقطة التي يقل فيها 10٪ من جميع قيم البيانات. العشري الثاني هو النقطة التي تقع فيها 20% من جميع قيم البيانات تحتها، وهكذا.

يمكننا استخدام بناء الجملة التالي لحساب أعشار مجموعة البيانات في R:

 quantile(data, probs = seq (.1, .9, by = .1 ))

يوضح المثال التالي كيفية استخدام هذه الوظيفة عمليًا.

مثال: حساب العشريات في R

يوضح الكود التالي كيفية إنشاء مجموعة بيانات مزيفة تحتوي على 20 قيمة ثم حساب القيم العشرية لمجموعة البيانات:

 #create dataset
data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
          89, 90, 91, 92, 93, 93, 94, 95, 97, 99)

#calculate deciles of dataset
quantile(data, probs = seq (.1, .9, by = .1 ))

 10% 20% 30% 40% 50% 60% 70% 80% 90% 
63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2 

طريقة تفسير العشريات هي كما يلي:

  • 10% من جميع قيم البيانات أقل من 63.4
  • 20% من جميع قيم البيانات أقل من 67.8 .
  • 30% من جميع قيم البيانات أقل من 76.5 .
  • 40% من جميع قيم البيانات أقل من 83.6 .
  • 50% من جميع قيم البيانات أقل من 88.5 .
  • 60% من جميع قيم البيانات أقل من 90.4 .
  • 70% من جميع قيم البيانات أقل من 92.3 .
  • 80% من جميع قيم البيانات أقل من 93.2 .
  • 90% من جميع قيم البيانات أقل من 95.2 .

تجدر الإشارة إلى أن القيمة عند المئين الخمسين تساوي القيمة المتوسطة لمجموعة البيانات.

مثال: وضع القيم بالعشريات في R

لوضع كل قيمة بيانات في فئة عشرية، يمكننا استخدام الدالة ntile(x, ngroups) من الحزمة dplyr في R.

إليك كيفية استخدام هذه الوظيفة لمجموعة البيانات التي أنشأناها في المثال السابق:

 library (dplyr)

#create dataset
data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                            89, 90, 91, 92, 93, 93, 94, 95, 97, 99))

#place each value into a decile
data$decile <- ntile(data, 10)

#viewdata
data

   values decile
1 56 1
2 58 1
3 64 2
4 67 2
5 68 3
6 73 3
7 78 4
8 83 4
9 84 5
10 88 5
11 89 6
12 90 6
13 91 7
14 92 7
15 93 8
16 93 8
17 94 9
18 95 9
19 97 10
20 99 10

وطريقة تفسير النتيجة هي كما يلي:

  • تقع قيمة البيانات 56 بين النسبة المئوية 0% و10%، لذا فهي تقع في العلامة العشرية الأولى.
  • تقع قيمة البيانات 58 بين النسبة المئوية 0% و10%، لذا فهي تقع في العلامة العشرية الأولى.
  • تقع قيمة البيانات 64 بين النسبة المئوية 10% و20%، لذا فهي تقع في الفئة العشرية الثانية.
  • تقع قيمة البيانات 67 بين النسبة المئوية 10% و20%، لذا فهي تقع في الفئة العشرية الثانية.
  • تقع قيمة البيانات 68 بين النسبة المئوية 20% و30%، لذا فهي تقع في الفئة العشرية الثالثة.

وما إلى ذلك وهلم جرا.

مصادر إضافية

كيفية حساب النسب المئوية في R
كيفية حساب الربعيات في R
كيفية إنشاء الجداول التكرارية في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *