كيفية استخدام دالة التجميع في لغة r (مع أمثلة)
يمكن استخدام وظيفة التجميع () من حزمة Tidyr “لتجميع” زوج المفتاح والقيمة عبر أعمدة متعددة.
تستخدم هذه الوظيفة بناء الجملة الأساسي التالي:
جمع (البيانات، القيمة الأساسية، وما إلى ذلك)
ذهب:
- البيانات : اسم إطار البيانات
- المفتاح : اسم العمود الرئيسي المراد إنشاؤه
- value : اسم عمود القيمة المراد إنشاؤه
- … : حدد الأعمدة المراد التجميع منها
توضح الأمثلة التالية كيفية استخدام هذه الوظيفة عمليًا.
مثال 1: جمع قيم عمودين
لنفترض أن لدينا إطار البيانات التالي في R:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12)) #view data frame df player year1 year2 1 to 12 22 2 B 15 29 3 C 19 18 4 D 19 12
يمكننا استخدام وظيفة التجميع () لإنشاء عمودين جديدين يسمى “السنة” و”النقاط” كما يلي:
library (tidyr) #gather data from columns 2 and 3 gather(df, key=" year ", value=" points ", 2:3) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12
مثال 2: جمع القيم من أكثر من عمودين
لنفترض أن لدينا إطار البيانات التالي في R:
#create data frame df2 <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12), year3=c(17, 17, 22, 25)) #view data frame df2 player year1 year2 year3 1 A 12 22 17 2 B 15 29 17 3 C 19 18 22 4 D 19 12 25
يمكننا استخدام دالة التجميع () “لجمع” القيم من الأعمدة 2 و3 و4 في عمودين جديدين يسميان “السنة” و”النقاط” كما يلي:
library (tidyr) #gather data from columns 2, 3, and 4 gather(df, key=" year ", value=" points ", 2:4) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12 9 A year3 17 10 B year3 17 11 C year3 22 12 D year3 25
مصادر إضافية
الهدف من حزمة Tidyr هو إنشاء بيانات “مرتبة” تتميز بالخصائص التالية:
- كل عمود هو متغير.
- كل سطر هو ملاحظة.
- كل خلية لها قيمة فريدة.
تستخدم حزمة Tidyr أربع وظائف رئيسية لإنشاء البيانات المطلوبة:
1. وظيفة الانتشار () .
2. وظيفة التجميع () .
3. الدالةالمنفصلة () .
4. وظيفة الوحدة () .
إذا أتقنت هذه الوظائف الأربع، فستتمكن من إنشاء بيانات “مرتبة” من أي إطار بيانات.