كيفية حساب الارتباط حسب المجموعة في r


يمكنك استخدام بناء الجملة الأساسي التالي لحساب الارتباط بين متغيرين حسب المجموعة في R:

 library (dplyr)

df %>%
  group_by(group_var) %>%
  summarize(cor=cor(var1, var2))

يحسب بناء الجملة هذا الارتباط بين var1 و var2 ، مجمعين حسب group_var .

يوضح المثال التالي كيفية استخدام بناء الجملة هذا عمليًا.

مثال: حساب الارتباط حسب المجموعة في R

لنفترض أن لدينا إطار البيانات التالي الذي يحتوي على معلومات حول لاعبي كرة السلة من فرق مختلفة:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28),
                 assists=c(2, 7, 9, 3, 12, 10, 14, 21))

#view data frame
df

  team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21

يمكننا استخدام الصيغة التالية من الحزمة dplyr لحساب الارتباط بين النقاط والتمريرات الحاسمة ، مجمعة حسب الفريق :

 library (dplyr)

df %>%
  group_by(team) %>%
  summarize(cor=cor(points, assists))

# A tibble: 2 x 2
  team horn
   
1 A 0.603
2 B 0.982

ومن النتيجة يمكننا أن نرى:

  • معامل الارتباط بين النقاط والتمريرات الحاسمة للفريق A هو 0.603 .
  • معامل الارتباط بين النقاط والتمريرات الحاسمة للفريق B هو 0.982 .

وبما أن كلا معاملي الارتباط إيجابيان، فهذا يخبرنا أن العلاقة بين النقاط والتمريرات الحاسمة لكلا الفريقين إيجابية.

ذات صلة: ما الذي يعتبر ارتباطًا “قويًا”؟

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ العمليات الشائعة الأخرى في R:

كيفية حساب القيم الفريدة حسب المجموعة في R
كيفية حساب المبلغ حسب المجموعة في R
كيفية حساب المتوسط لكل مجموعة في R
كيفية حساب إحصائيات الملخص حسب المجموعة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *