كيفية تحديد خطوط عشوائية في r باستخدام dplyr
يمكنك استخدام الطرق التالية لتحديد صفوف عشوائية في إطار البيانات في R باستخدام الوظائف الموجودة في الحزمة dplyr :
الطريقة الأولى: تحديد عدد عشوائي من الصفوف
df %>% sample_n( 5 )
تقوم هذه الوظيفة باختيار 5 صفوف من إطار البيانات بشكل عشوائي.
الطريقة الثانية: تحديد جزء عشوائي من الصفوف
df %>% sample_frac( .25 )
تقوم هذه الوظيفة باختيار 25% من جميع الصفوف في إطار البيانات بشكل عشوائي.
توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع إطار البيانات التالي في R:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
مثال 1: حدد عددًا عشوائيًا من الصفوف
يمكننا استخدام الكود التالي لتحديد 5 صفوف بشكل عشوائي من إطار البيانات:
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
لاحظ أنه تم اختيار خمسة صفوف بشكل عشوائي من إطار البيانات.
مثال 2: حدد جزءًا عشوائيًا من الصفوف
يمكننا استخدام الكود التالي لتحديد 25% من جميع الصفوف في إطار البيانات بشكل عشوائي:
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
نظرًا لأن إطار البيانات الأصلي كان يحتوي على 8 قيم إجمالية، فإن 25% من 8 يساوي 2.
وبالتالي، يتم اختيار صفين بشكل عشوائي من إطار البيانات.
ملاحظة : يمكنك العثور على الوثائق الكاملة لوظائف Sample_n و sample_frac في dplyr هنا .
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في dplyr:
كيفية تحديد الأعمدة حسب الفهرس باستخدام dplyr
كيفية تحديد الصف الأول حسب المجموعة باستخدام dplyr
كيفية التصفية حسب شروط متعددة باستخدام dplyr
كيفية تصفية الصفوف التي تحتوي على سلسلة معينة باستخدام dplyr