كيفية تقسيم البيانات إلى مجموعات متساوية الحجم في r


يمكنك استخدام الدالة cut_number() لحزمة ggplot2 في R لتقسيم المتجه إلى مجموعات متساوية الحجم.

تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:

قطع_رقم(س،ن)

ذهب:

  • x: اسم المتجه الرقمي المراد تقسيمه
  • ن: عدد المجموعات

يوضح المثال التالي كيفية استخدام هذه الوظيفة عمليًا.

مثال: كيفية تقسيم البيانات إلى مجموعات متساوية الحجم في R

لنفترض أن لدينا إطار البيانات التالي في R الذي يحتوي على معلومات حول النقاط التي سجلها 12 لاعب كرة سلة مختلف

 #create data frame
df <- data. frame (player=LETTERS[1:12],
                 points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22))

#view data frame
df

   player points
1 to 1
2 B 2
3 C 2
4 D 2
5 E 4
6 F 5
7 G 7
8:9 a.m.
9 I 12
10 D 14
11K15
12 L 22

ذات صلة: كيفية استخدام وظيفة الحروف في R

يمكننا استخدام الدالة cut_number() من الحزمة ggplot2 لإنشاء عمود جديد يسمى المجموعة الذي يقسم كل صف من إطار البيانات إلى واحدة من ثلاث مجموعات بناءً على القيمة الموجودة في عمود النقاط :

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- cut_number(df$points, 3)

#view updated data frame
df

   player points group
1 To 1 [1,3.33]
2 B 2 [1,3.33]
3 C 2 [1,3.33]
4 D 2 [1,3.33]
5 E 4 (3.33.10]
6 F 5 (3.33.10]
7 G 7 (3.33.10]
8 A.M. 9 (3.33.10]
9 I 12 (10.22]
10 J 14 (10.22]
11 K 15 (10.22]
12 L 22 (10.22]

تم وضع كل لاعب من اللاعبين الـ12 في واحدة من ثلاث مجموعات بناءً على القيمة الموضحة في عمود النقاط .

من النتيجة يمكننا أن نرى أن هناك 3 مجموعات متميزة:

  • المجموعة 1: قيمة النقاط تتراوح بين 1 و3.33.
  • المجموعة 2: قيمة النقاط تتراوح بين 3.33 و 10.
  • المجموعة 3: قيمة النقاط تتراوح بين 10 و 22.

يمكننا أن نرى أنه تم وضع أربعة لاعبين في كل مجموعة.

إذا كنت تريد أن يعرض عمود المجموعة المجموعات كقيم عددية، فيمكنك لف الدالة Cut_number() في دالة as.numeric() :

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- as. numeric (cut_number(df$points, 3))

#view updated data frame
df

   player points group
1 A 1 1
2 B 2 1
3 C 2 1
4 D 2 1
5 E 4 2
6 F 5 2
7 G 7 2
8:92 a.m.
9 I 12 3
10 D 14 3
11 K 15 3
12 L 22 3

يحتوي عمود المجموعة الجديد الآن على القيم 1 و2 و3 للإشارة إلى المجموعة التي ينتمي إليها اللاعب.

مرة أخرى، تضم كل مجموعة أربعة لاعبين.

ملاحظة : لتقسيم عمود النقاط إلى أكثر من ثلاث مجموعات، ما عليك سوى استبدال الرقم 3 في الدالة cut_number() برقم مختلف.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:

كيفية تقسيم إطار البيانات في R
كيفية تقسيم البيانات إلى مجموعات تدريب واختبار في R
كيفية إجراء تجميع البيانات في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *