كيفية حساب الارتباط حسب المجموعة في r
يمكنك استخدام بناء الجملة الأساسي التالي لحساب الارتباط بين متغيرين حسب المجموعة في R:
library (dplyr)
df %>%
group_by(group_var) %>%
summarize(cor=cor(var1, var2))
يحسب بناء الجملة هذا الارتباط بين var1 و var2 ، مجمعين حسب group_var .
يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.
مثال: حساب الارتباط حسب المجموعة في R
لنفترض أن لدينا إطار البيانات التالي الذي يحتوي على معلومات حول لاعبي كرة السلة من فرق مختلفة:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(18, 22, 19, 14, 14, 11, 20, 28),
assists=c(2, 7, 9, 3, 12, 10, 14, 21))
#view data frame
df
team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21
يمكننا استخدام الصيغة التالية من الحزمة dplyr لحساب الارتباط بين النقاط والتمريرات الحاسمة ، مجمعة حسب الفريق :
library (dplyr)
df %>%
group_by(team) %>%
summarize(cor=cor(points, assists))
# A tibble: 2 x 2
team horn
1 A 0.603
2 B 0.982
ومن النتيجة يمكننا أن نرى:
- معامل الارتباط بين النقاط والتمريرات الحاسمة للفريق A هو 0.603 .
- معامل الارتباط بين النقاط والتمريرات الحاسمة للفريق B هو 0.982 .
وبما أن كلا معاملي الارتباط إيجابيان، فهذا يخبرنا أن العلاقة بين النقاط والتمريرات الحاسمة لكلا الفريقين إيجابية.
ذات صلة: ما الذي يعتبر ارتباطًا “قويًا”؟
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في R:
كيفية حساب القيم الفريدة حسب المجموعة في R
كيفية حساب المبلغ حسب المجموعة في R
كيفية حساب المتوسط لكل مجموعة في R
كيفية حساب إحصائيات الملخص حسب المجموعة في R