الدليل الكامل: كيفية استخدام الدالة aggregate() في r


يمكن استخدام الدالة Aggregate() في R لحساب إحصائيات التلخيص لمجموعة من البيانات.

تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:

التجميعي (x، بواسطة، FUN)

ذهب:

  • x : متغير للتجميع
  • بواسطة : قائمة بالمتغيرات التي سيتم التجميع حسبها
  • FUN : ملخص إحصائي لحساب

توضح الأمثلة التالية كيفية استخدام هذه الوظيفة عمليًا مع إطار البيانات التالي في R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'G', 'F', 'F'),
                 points=c(99, 90, 86, 88, 95, 99),
                 assists=c(33, 28, 31, 39, 34, 23),
                 rebounds=c(30, 28, 24, 24, 28, 33))

#view data frame
df

  team position points assists rebounds
1 AG 99 33 30
2 AG 90 28 28
3 AF 86 31 24
4 BG 88 39 24
5 BF 95 34 28
6 BF 99 23 33

مثال 1: المتوسط الإجمالي لكل مجموعة

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() لحساب متوسط عدد النقاط المسجلة لكل فريق:

 #find mean points by team
aggregate(df$points, by=list(df$team), FUN=mean)

  Group.1 x
1 A 91.66667
2 B 94.00000

هذا يخبرنا:

  • سجل لاعبو الفريق “أ” معدل 91.67 نقطة في المباراة الواحدة.
  • سجل لاعبو الفريق B متوسط 94 نقطة في المباراة الواحدة.

لاحظ أنه يمكنك أيضًا تغيير أسماء الأعمدة في المخرجات باستخدام الدالة colnames() :

 #find mean points by team
agg <- aggregate(df$points, by=list(df$team), FUN=mean)

#rename columns in output
colnames(agg) <- c(' Team ', ' Mean_Points ')

#viewoutput
agg

  Team Mean_Points
1 A 91.66667
2 B 94.00000

مثال 2: حساب مجمع حسب المجموعة

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() لحساب عدد اللاعبين لكل فريق:

 #count number of players per team
aggregate(df$points, by=list(df$team), FUN=length)

  Group.1 x
1 to 3
2 B 3

هذا يخبرنا:

  • يتكون الفريق أ من 3 لاعبين.
  • يتكون الفريق B من 3 لاعبين.

مثال 3: المبلغ الإجمالي لكل مجموعة

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() لحساب مجموع النقاط التي سجلها كل فريق:

 #find sum of points scored by team
aggregate(df$points, by=list(df$team), FUN=sum)

  Group.1 x
1 to 275
2 B 282

هذا يخبرنا:

  • حصل فريق A على مجموع 275 نقطة.
  • حصل الفريق B على مجموع 282 نقطة.

المثال 4: تجميع أعمدة متعددة

يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() للعثور على متوسط عدد النقاط المسجلة، مجمعة حسب الفريق والمنصب:

 #find mean of points scored, grouped by team and position
aggregate(df$points, by=list(df$team, df$position), FUN=mean)

  Group.1 Group.2 x
1AF 86.0
2 BF 97.0
3 AG 94.5
4 BG 88.0

هذا يخبرنا:

  • سجل اللاعبون في المركز “F” في الفريق A متوسط 86 نقطة.
  • سجل لاعبو الفريق “F” في الفريق B متوسط 97 نقطة.
  • سجل اللاعبون في المركز “G” في الفريق A متوسط 94.5 نقطة.
  • سجل اللاعبون في المركز “G” في الفريق B متوسط 88 نقطة.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية استخدام الوظائف الشائعة الأخرى في R:

كيفية استخدام وظيفة الجدول () في R
كيفية استخدام الدالة gsub() في R
كيفية استخدام وظيفة الملخص () في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *