كيفية تحديد قيم n الأولى حسب المجموعة في r


يمكنك استخدام أي من الطرق التالية لتحديد أعلى قيم N حسب المجموعة في R:

الطريقة الأولى: تحديد قيم N الأولى لكل مجموعة (تجاهل الروابط)

 library (dplyr)

#select top 5 values by group
df %>% 
  arrange(desc(values_column)) %>% 
  group_by(group_column) %>%
  slice(1:5)

الطريقة الثانية: تحديد قيم N الأولى حسب المجموعة (بما في ذلك الروابط)

 library (dplyr)

#select top 5 values by group
df %>%
  group_by(group_column) %>%
  top_n(5, values_column)

توضح الأمثلة التالية كيفية استخدام كل طريقة مع إطار البيانات التالي في R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(19, 22, 15, NA, 14, 25, 25, 25),
                 rebounds=c(10, 6, 3, 7, 11, 13, 9, 12))

#view data frame
df

  team points rebounds
1 A 19 10
2 to 22 6
3 to 15 3
4 A NA 7
5 B 14 11
6 B 25 13
7 B 25 9
8 B 25 12

مثال 1: حدد قيم N الأولى لكل مجموعة (تجاهل الروابط)

يوضح التعليمة البرمجية التالية كيفية تحديد أول صفين بأعلى قيم النقاط، مجمعين حسب الفريق:

 library (dplyr)

#select top 2 rows with highest points values, grouped by team 
df %>% 
  arrange(desc(points)) %>% 
  group_by(team) %>%
  slice(1:2)

# A tibble: 4 x 3
# Groups: team [2]
  team points rebounds
        
1 to 22 6
2 A 19 10
3 B 25 13
4 B 25 9

تحتوي النتيجة على الصفين مع أعلى قيم النقطة لكل فريق.

لاحظ أنه بالنسبة للفريق ب، كان هناك في الواقع ثلاثة صفوف مرتبطة بأعلى قيمة للنقطة ( 25 )، ولكن يتم إرجاع صفين فقط في الإخراج.

هذه الطريقة تتجاهل الروابط ببساطة.

مثال 2: حدد قيم N الأولى لكل مجموعة (بما في ذلك الروابط)

يوضح التعليمة البرمجية التالية كيفية تحديد أول صفين بأعلى قيم النقاط، مجمعين حسب الفريق:

 library (dplyr)

#select top 2 rows with highest points values, grouped by team 
df %>%
  group_by(team) %>%
  top_n(2, dots)

# A tibble: 5 x 3
# Groups: team [2]
  team points rebounds
        
1 A 19 10
2 to 22 6
3 B 25 13
4 B 25 9
5 B 25 12

تحتوي النتيجة على الصفين مع أعلى قيم النقطة لكل فريق.

لاحظ أنه بالنسبة للفريق B، تم ربط ثلاثة أسطر بأعلى قيمة نقطة ( 25 )، لذلك قامت هذه الطريقة بتضمين تلك الأسطر الثلاثة في النتيجة النهائية.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في R:

كيفية تحديد الصفوف التي تظهر فيها القيمة في أي عمود في R
كيفية تحديد أعمدة محددة في R
كيفية تحديد الأعمدة حسب الفهرس في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *