كيفية استخدام وظيفة القطع () في r
يمكن استخدام وظيفة القطع () في R لقص مجموعة من القيم في صناديق وتحديد تسميات لكل سلة.
تستخدم هذه الوظيفة بناء الجملة التالي:
قطع (س، فواصل، تسميات = NULL، …)
ذهب:
- س : اسم المتجه
- فترات الاستراحة : عدد فترات الاستراحة التي يجب إجراؤها أو ناقل نقاط الاستراحة
- التسميات : تسميات للصناديق الناتجة
توضح الأمثلة التالية كيفية استخدام هذه الوظيفة في سيناريوهات مختلفة مع إطار البيانات التالي في R:
#create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'),
points=c(4, 7, 8, 12, 14, 16, 20, 26, 36))
#view data frame
df
player points
1 to 4
2 B 7
3 C 8
4 D 12
5 E 14
6 F 16
7 G 20
8:26 a.m.
9 I 36
مثال 1: قص المتجه بناءً على عدد الفواصل
يوضح التعليمة البرمجية التالية كيفية استخدام وظيفة القطع () لإنشاء عمود جديد يسمى الفئة التي تقطع عمود النقاط إلى مجموعات من أربعة أحجام متساوية:
#create new column that places each player into four categories based on points
df$category <- cut(df$points, breaks= 4 )
#view updated data frame
df
player points category
1 to 4 (3.97.12]
2 B 7 (3.97.12]
3 C 8 (3.97.12]
4 D 12 (3.97.12]
5 E 14 (12.20]
6 F 16 (12.20]
7 G 20 (12.20]
8:26 a.m. (20.28]
9 I 36 (28.36]
وبما أننا حددنا فواصل=4 ، فإن الدالة Cut() تقسم القيم الموجودة في عمود النقطة إلى مجموعات من أربعة أحجام متساوية.
إليك كيفية قيام وظيفة القطع () بهذا:
- أولاً وجد الفرق بين أكبر وأصغر القيم في عمود النقاط (36 – 4 = 32).
- ثم يقسم هذا الفرق على 4 (32 / 4 = 8)
- والنتيجة هي أربع صناديق بعرض 8 لكل منها.
ملاحظة : أدنى فاصل زمني هو 3.97 بدلاً من 4 بسبب الوظيفة التالية من وثائق القطع () :
عندما يتم تحديد فترات التوقف المؤقت كرقم واحد، يتم تقسيم نطاق البيانات إلى أجزاء متساوية الطول من فترات التوقف المؤقت، ثم يتم نقل الحدود الخارجية بنسبة 0.1% بعيدًا عن النطاق لضمان وقوع القيم المتطرفة ضمن فترات التوقف المؤقت.
المثال 2: قطع المتجهات بناءً على نقاط توقف محددة
يوضح التعليمة البرمجية التالية كيفية استخدام وظيفة القطع () لإنشاء عمود جديد يسمى الفئة التي تقطع عمود النقاط بناءً على متجه نقاط توقف محددة:
#create new column based on specific break points
df$category <- cut(df$points, breaks=c(0, 10, 15, 20, 40))
#view updated data frame
df
player points category
1 to 4 (0.10]
2 B 7 (0.10]
3 C 8 (0.10]
4 D 12 (10.15]
5 E 14 (10.15]
6 F 16 (15.20]
7 G 20 (15.20]
8:26 a.m. (20.40)
9 I 36 (20.40]
تقوم وظيفة القطع () بتصنيف كل لاعب إلى فئات بناءً على المتجه المحدد لنقاط التوقف التي قدمناها.
المثال 3: قص متجه باستخدام نقاط توقف وتسميات محددة
يوضح التعليمة البرمجية التالية كيفية استخدام وظيفة القطع () لإنشاء عمود جديد يسمى الفئة التي تقطع عمود النقاط بناءً على متجه نقاط توقف محددة مع تسميات مخصصة:
#create new column based on values in points column
df$category <- cut(df$points,
breaks=c(0, 10, 15, 20, 40),
labels=c(' Bad ', ' OK ', ' Good ', ' Great '))
#view updated data frame
df
player points category
1 A 4 Bad
2 B 7 Bad
3 C 8 Bad
4 D 12 OK
5 E 14 OK
6 F 16 Good
7 G 20 Good
8:26 A.M. Great
9 I 36 Great
يقوم عمود الفئة الجديدة بتصنيف كل لاعب على أنه سيء أو جيد أو جيد أو ممتاز بناءً على القيمة المقابلة في عمود النقاط .
ملاحظة : يجب أن يكون عدد التسميات دائمًا أقل من عدد نقاط التوقف لتجنب الخطأ التالي:
Error in cut.default(df$points, breaks = c(0, 10, 15, 20, 40), labels = c("Bad",:
lengths of 'breaks' and 'labels' differ
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية استخدام الوظائف الشائعة الأخرى في R:
كيفية استخدام وظيفة tabulate() في R
كيفية استخدام الدالة Split() في R
كيفية استخدام الدالة match() في R
كيفية استخدام وظيفة النسخ المتماثل () في R