كيفية تجميع أعمدة متعددة في لغة r (مع أمثلة)
يمكننا استخدام الدالة Aggregate() في R لإنتاج إحصائيات ملخصة لمتغير واحد أو أكثر في إطار البيانات.
تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:
التجميع (sum_var ~ group_var، البيانات = df، FUN = المتوسط)
ذهب:
- sum_var: المتغير المراد تلخيصه
- group_var: المتغير للمجموعة
- البيانات: اسم كتلة البيانات
- FUN: إحصائية موجزة لحساب
يوفر هذا البرنامج التعليمي عدة أمثلة لاستخدام هذه الوظيفة لتجميع عمود واحد أو أكثر في وقت واحد في R، باستخدام إطار البيانات التالي كمثال:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'), conf=c('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'), points=c(1, 3, 3, 4, 5, 7, 7, 9), rebounds=c(7, 7, 8, 3, 2, 7, 14, 13)) #view data frame df team conf points rebounds 1 AE 1 7 2 AE 3 7 3 AW 3 8 4 BW 4 3 5 BW 5 2 6 BW 7 7 7 CW 7 14 8 CW 9 13
مثال 1: تلخيص متغير والتجميع حسب متغير
يوضح الكود التالي كيفية العثور على متوسط النقاط المسجلة، مجمعة حسب الفريق:
#find mean points scored, grouped by team aggregate(points ~ team, data = df, FUN = mean, na. rm = TRUE ) team points 1 A 2.333333 2 B 5.333333 3 C 8.000000
مثال 2: تلخيص متغير وتجميعه حسب متغيرات متعددة
يوضح الكود التالي كيفية العثور على متوسط النقاط المسجلة، مجمعة حسب الفريق والمؤتمر:
#find mean points scored, grouped by team and conference aggregate(points ~ team + conf, data = df, FUN = mean, na. rm = TRUE ) team conf points 1 AE 2.000000 2 AW 3.000000 3 BW 5.333333 4 CW 8.000000
مثال 3: تلخيص متغيرات متعددة وتجميعها حسب متغير واحد
يوضح التعليمة البرمجية التالية كيفية العثور على متوسطات التسجيل ومعدلات الارتداد، مجمعة حسب الفريق:
#find mean points scored, grouped by team and conference aggregate( cbind (points,rebounds) ~ team, data = df, FUN = mean, na. rm = TRUE ) team points rebounds 1 A 2.333333 7.333333 2 B 5.333333 4.000000 3 C 8.000000 13.500000
المثال 4: تلخيص متغيرات متعددة والتجميع حسب متغيرات متعددة
يوضح التعليمة البرمجية التالية كيفية العثور على متوسطات التسجيل ومعدلات الارتداد، مجمعة حسب الفريق والمؤتمر:
#find mean points scored, grouped by team and conference aggregate( cbind (points,rebounds) ~ team + conf, data = df, FUN = mean, na. rm = TRUE ) team conf points rebounds 1 AE 2.000000 7.0 2AW 3.000000 8.0 3 BW 5.333333 4.0 4 CW 8.000000 13.5
مصادر إضافية
كيفية حساب متوسط أعمدة متعددة في R
كيفية جمع أعمدة محددة في R
كيفية جمع صفوف محددة في R