आर में समूह द्वारा सहसंबंध की गणना कैसे करें
आप आर में समूह द्वारा दो चर के बीच सहसंबंध की गणना करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:
library (dplyr)
df %>%
group_by(group_var) %>%
summarize(cor=cor(var1, var2))
यह विशेष वाक्यविन्यास var1 और var2 के बीच सहसंबंध की गणना करता है, जिसे Group_var द्वारा समूहीकृत किया गया है।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: आर में समूह द्वारा सहसंबंध की गणना करें
मान लीजिए कि हमारे पास निम्नलिखित डेटा फ़्रेम है जिसमें विभिन्न टीमों के बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(18, 22, 19, 14, 14, 11, 20, 28),
assists=c(2, 7, 9, 3, 12, 10, 14, 21))
#view data frame
df
team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21
हम टीम द्वारा समूहीकृत बिंदुओं और सहायताओं के बीच सहसंबंध की गणना करने के लिए dplyr पैकेज से निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
library (dplyr)
df %>%
group_by(team) %>%
summarize(cor=cor(points, assists))
# A tibble: 2 x 2
team horn
1 A 0.603
2 B 0.982
परिणाम से हम देख सकते हैं:
- टीम ए के लिए अंक और सहायता के बीच सहसंबंध गुणांक 0.603 है।
- टीम बी के लिए अंक और सहायता के बीच सहसंबंध गुणांक 0.982 है।
चूँकि दोनों सहसंबंध गुणांक सकारात्मक हैं, यह हमें बताता है कि दोनों टीमों के लिए अंक और सहायता के बीच संबंध सकारात्मक है।
संबंधित: “मजबूत” सहसंबंध क्या माना जाता है?
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ऑपरेशन कैसे करें:
आर में समूह द्वारा अद्वितीय मानों की गणना कैसे करें
आर में समूह द्वारा योग की गणना कैसे करें
आर में प्रति समूह माध्य की गणना कैसे करें
आर में समूह द्वारा सारांश आंकड़ों की गणना कैसे करें