الدليل الكامل: كيفية استخدام الدالة aggregate() في r
يمكن استخدام الدالة Aggregate() في R لحساب إحصائيات التلخيص لمجموعة من البيانات.
تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:
التجميعي (x، بواسطة، FUN)
ذهب:
- x : متغير للتجميع
- بواسطة : قائمة بالمتغيرات التي سيتم التجميع حسبها
- FUN : ملخص إحصائي لحساب
توضح الأمثلة التالية كيفية استخدام هذه الوظيفة عمليًا مع إطار البيانات التالي في R:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'G', 'F', 'F'), points=c(99, 90, 86, 88, 95, 99), assists=c(33, 28, 31, 39, 34, 23), rebounds=c(30, 28, 24, 24, 28, 33)) #view data frame df team position points assists rebounds 1 AG 99 33 30 2 AG 90 28 28 3 AF 86 31 24 4 BG 88 39 24 5 BF 95 34 28 6 BF 99 23 33
مثال 1: المتوسط الإجمالي لكل مجموعة
يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() لحساب متوسط عدد النقاط المسجلة لكل فريق:
#find mean points by team
aggregate(df$points, by=list(df$team), FUN=mean)
Group.1 x
1 A 91.66667
2 B 94.00000
هذا يخبرنا:
- سجل لاعبو الفريق “أ” معدل 91.67 نقطة في المباراة الواحدة.
- سجل لاعبو الفريق B متوسط 94 نقطة في المباراة الواحدة.
لاحظ أنه يمكنك أيضًا تغيير أسماء الأعمدة في المخرجات باستخدام الدالة colnames() :
#find mean points by team agg <- aggregate(df$points, by=list(df$team), FUN=mean) #rename columns in output colnames(agg) <- c(' Team ', ' Mean_Points ') #viewoutput agg Team Mean_Points 1 A 91.66667 2 B 94.00000
مثال 2: حساب مجمع حسب المجموعة
يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() لحساب عدد اللاعبين لكل فريق:
#count number of players per team
aggregate(df$points, by=list(df$team), FUN=length)
Group.1 x
1 to 3
2 B 3
هذا يخبرنا:
- يتكون الفريق أ من 3 لاعبين.
- يتكون الفريق B من 3 لاعبين.
مثال 3: المبلغ الإجمالي لكل مجموعة
يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() لحساب مجموع النقاط التي سجلها كل فريق:
#find sum of points scored by team
aggregate(df$points, by=list(df$team), FUN=sum)
Group.1 x
1 to 275
2 B 282
هذا يخبرنا:
- حصل فريق A على مجموع 275 نقطة.
- حصل الفريق B على مجموع 282 نقطة.
المثال 4: تجميع أعمدة متعددة
يوضح التعليمة البرمجية التالية كيفية استخدام الدالة Aggregate() للعثور على متوسط عدد النقاط المسجلة، مجمعة حسب الفريق والمنصب:
#find mean of points scored, grouped by team and position
aggregate(df$points, by=list(df$team, df$position), FUN=mean)
Group.1 Group.2 x
1AF 86.0
2 BF 97.0
3 AG 94.5
4 BG 88.0
هذا يخبرنا:
- سجل اللاعبون في المركز “F” في الفريق A متوسط 86 نقطة.
- سجل لاعبو الفريق “F” في الفريق B متوسط 97 نقطة.
- سجل اللاعبون في المركز “G” في الفريق A متوسط 94.5 نقطة.
- سجل اللاعبون في المركز “G” في الفريق B متوسط 88 نقطة.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية استخدام الوظائف الشائعة الأخرى في R:
كيفية استخدام وظيفة الجدول () في R
كيفية استخدام الدالة gsub() في R
كيفية استخدام وظيفة الملخص () في R