आर में समूह द्वारा सहसंबंध की गणना कैसे करें


आप आर में समूह द्वारा दो चर के बीच सहसंबंध की गणना करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 library (dplyr)

df %>%
  group_by(group_var) %>%
  summarize(cor=cor(var1, var2))

यह विशेष वाक्यविन्यास var1 और var2 के बीच सहसंबंध की गणना करता है, जिसे Group_var द्वारा समूहीकृत किया गया है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: आर में समूह द्वारा सहसंबंध की गणना करें

मान लीजिए कि हमारे पास निम्नलिखित डेटा फ़्रेम है जिसमें विभिन्न टीमों के बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28),
                 assists=c(2, 7, 9, 3, 12, 10, 14, 21))

#view data frame
df

  team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21

हम टीम द्वारा समूहीकृत बिंदुओं और सहायताओं के बीच सहसंबंध की गणना करने के लिए dplyr पैकेज से निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 library (dplyr)

df %>%
  group_by(team) %>%
  summarize(cor=cor(points, assists))

# A tibble: 2 x 2
  team horn
   
1 A 0.603
2 B 0.982

परिणाम से हम देख सकते हैं:

  • टीम ए के लिए अंक और सहायता के बीच सहसंबंध गुणांक 0.603 है।
  • टीम बी के लिए अंक और सहायता के बीच सहसंबंध गुणांक 0.982 है।

चूँकि दोनों सहसंबंध गुणांक सकारात्मक हैं, यह हमें बताता है कि दोनों टीमों के लिए अंक और सहायता के बीच संबंध सकारात्मक है।

संबंधित: “मजबूत” सहसंबंध क्या माना जाता है?

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ऑपरेशन कैसे करें:

आर में समूह द्वारा अद्वितीय मानों की गणना कैसे करें
आर में समूह द्वारा योग की गणना कैसे करें
आर में प्रति समूह माध्य की गणना कैसे करें
आर में समूह द्वारा सारांश आंकड़ों की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *