كيفية حساب التكرارات في r: مع الأمثلة
يمكنك استخدام الطرق التالية لحساب التكرارات في إطار البيانات في R:
الطريقة الأولى: حساب القيم المكررة في عمود
sum(duplicated(df$my_column))
الطريقة الثانية: حساب الصفوف المكررة
nrow(df[duplicated(df), ])
الطريقة الثالثة: حساب التكرارات لكل صف فريد
library (dplyr)
df %>% group_by_all() %>% count
توضح الأمثلة التالية كيفية استخدام كل طريقة عمليًا مع إطار البيانات التالي في R:
#create data frame
df = data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'),
points=c(5, 5, 8, 10, 5, 7, 10, 10))
#view data frame
df
team position points
1 GA 5
2 AG 5
3 AG 8
4 AF 10
5 BG 5
6 BG 7
7 BF 10
8 BF 10
مثال 1: حساب القيم المكررة في عمود
الكود التالي يوضح كيفية حساب عدد القيم المكررة في عمود النقاط :
#count number of duplicate values in points column
sum(duplicated(df$points))
[1] 4
يمكننا أن نرى أن هناك 4 قيم مكررة في عمود النقاط .
المثال 2: حساب الصفوف المكررة
يوضح التعليمة البرمجية التالية كيفية حساب عدد الصفوف المكررة في إطار البيانات:
#count number of duplicate rows
nrow(df[duplicated(df), ])
[1] 2
يمكننا أن نرى أن هناك صفين مكررين في إطار البيانات.
يمكننا استخدام بناء الجملة التالي لعرض هذين الخطين المكررين:
#display duplicated rows
df[duplicated(df), ]
team position points
2 AG 5
8 BF 10
مثال 3: حساب التكرارات لكل صف فريد
يوضح التعليمة البرمجية التالية كيفية حساب عدد التكرارات لكل صف فريد في إطار البيانات:
library (dplyr)
#count number of duplicate rows in data frame
df %>% group_by_all() %>% count
# A tibble: 6 x 4
# Groups: team, position, points [6]
team position points n
1 AF 10 1
2 AG 5 2
3 GA 8 1
4 BF 10 2
5 BG 5 1
6 BG 7 1
يعرض العمود n عدد التكرارات لكل صف فريد.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:
كيفية البحث عن العناصر المكررة باستخدام dplyr
كيفية إزالة الخطوط المكررة في R
كيفية إزالة الخطوط المكررة في R حتى لا يتبقى منها شيء