كيفية إنشاء جدول تكراري حسب المجموعة في r
يمكنك استخدام الوظائف التالية من حزمة dplyr لإنشاء جدول ترددي حسب المجموعة في R:
library (dplyr) df %>% group_by (var1, var2) %>% summarize (Freq=n())
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: إنشاء جدول تكراري حسب المجموعة
لنفترض أن لدينا إطار البيانات التالي في R:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'G', 'F', 'G', 'F', 'F', 'C'))
#view data frame
df
team position
1 AG
2 AG
3 AG
4 AF
5 BG
6 BF
7 BF
8 BC
لنفترض أننا نريد إنشاء جدول تكراري يوضح تكرار كل مركز، مجمعًا حسب الفريق.
يمكننا استخدام بناء الجملة التالي للقيام بذلك:
library (dplyr)
#calculate frequency of position, grouped by team
df %>%
group_by (team, position) %>%
summarize (Freq=n())
# A tibble: 5 x 3
# Groups: team [2]
team position Freq
1 AF 1
2 AG 3
3 BC 1
4 BF 2
5 BG 1
وإليك كيفية تفسير النتيجة:
- لاعب واحد من الفريق “أ” يشغل المركز “F”
- 3 لاعبين من الفريق A لديهم المركز ‘G’
- لاعب واحد من الفريق B يشغل المركز “C”
- لاعبان من الفريق B يشغلان المركز “F”
- لاعب واحد من الفريق B يشغل المركز “G”
لاحظ أنه يمكننا إعادة تسمية العمود الذي يحتوي على التكرارات عن طريق تغيير اسم المتغير في الدالة Summary() .
على سبيل المثال، يمكننا إعادة تسمية العمود “count” بدلاً من ذلك:
library (dplyr)
#calculate frequency of position, grouped by team
df %>%
group_by (team, position) %>%
summarize (count=n())
# A tibble: 5 x 3
# Groups: team [2]
team position count
1 AF 1
2 AG 3
3 BC 1
4 BF 2
5 BG 1
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ وظائف شائعة أخرى في dplyr:
كيفية حساب الترددات النسبية باستخدام dplyr
كيفية فرز المتغيرات حسب المجموعة باستخدام dplyr
كيفية تحديد الأعمدة حسب الفهرس باستخدام dplyr