كيفية تقسيم البيانات إلى مجموعات متساوية الحجم في r
يمكنك استخدام الدالة cut_number() لحزمة ggplot2 في R لتقسيم المتجه إلى مجموعات متساوية الحجم.
تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:
قطع_رقم(س،ن)
ذهب:
- x: اسم المتجه الرقمي المراد تقسيمه
- ن: عدد المجموعات
يوضح المثال التالي كيفية استخدام هذه الوظيفة عمليًا.
مثال: كيفية تقسيم البيانات إلى مجموعات متساوية الحجم في R
لنفترض أن لدينا إطار البيانات التالي في R الذي يحتوي على معلومات حول النقاط التي سجلها 12 لاعب كرة سلة مختلف
#create data frame df <- data. frame (player=LETTERS[1:12], points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22)) #view data frame df player points 1 to 1 2 B 2 3 C 2 4 D 2 5 E 4 6 F 5 7 G 7 8:9 a.m. 9 I 12 10 D 14 11K15 12 L 22
ذات صلة: كيفية استخدام وظيفة الحروف في R
يمكننا استخدام الدالة cut_number() من الحزمة ggplot2 لإنشاء عمود جديد يسمى المجموعة الذي يقسم كل صف من إطار البيانات إلى واحدة من ثلاث مجموعات بناءً على القيمة الموجودة في عمود النقاط :
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- cut_number(df$points, 3) #view updated data frame df player points group 1 To 1 [1,3.33] 2 B 2 [1,3.33] 3 C 2 [1,3.33] 4 D 2 [1,3.33] 5 E 4 (3.33.10] 6 F 5 (3.33.10] 7 G 7 (3.33.10] 8 A.M. 9 (3.33.10] 9 I 12 (10.22] 10 J 14 (10.22] 11 K 15 (10.22] 12 L 22 (10.22]
تم وضع كل لاعب من اللاعبين الـ12 في واحدة من ثلاث مجموعات بناءً على القيمة الموضحة في عمود النقاط .
من النتيجة يمكننا أن نرى أن هناك 3 مجموعات متميزة:
- المجموعة 1: قيمة النقاط تتراوح بين 1 و3.33.
- المجموعة 2: قيمة النقاط تتراوح بين 3.33 و 10.
- المجموعة 3: قيمة النقاط تتراوح بين 10 و 22.
يمكننا أن نرى أنه تم وضع أربعة لاعبين في كل مجموعة.
إذا كنت تريد أن يعرض عمود المجموعة المجموعات كقيم عددية، فيمكنك لف الدالة Cut_number() في دالة as.numeric() :
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- as. numeric (cut_number(df$points, 3)) #view updated data frame df player points group 1 A 1 1 2 B 2 1 3 C 2 1 4 D 2 1 5 E 4 2 6 F 5 2 7 G 7 2 8:92 a.m. 9 I 12 3 10 D 14 3 11 K 15 3 12 L 22 3
يحتوي عمود المجموعة الجديد الآن على القيم 1 و2 و3 للإشارة إلى المجموعة التي ينتمي إليها اللاعب.
مرة أخرى، تضم كل مجموعة أربعة لاعبين.
ملاحظة : لتقسيم عمود النقاط إلى أكثر من ثلاث مجموعات، ما عليك سوى استبدال الرقم 3 في الدالة cut_number() برقم مختلف.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:
كيفية تقسيم إطار البيانات في R
كيفية تقسيم البيانات إلى مجموعات تدريب واختبار في R
كيفية إجراء تجميع البيانات في R