आर में सहसंबंध मैट्रिक्स कैसे बनाएं (4 उदाहरण)


सहसंबंध मैट्रिक्स एक वर्गाकार तालिका है जो डेटा सेट में चर के बीच सहसंबंध गुणांक दिखाती है।

यह डेटा सेट में चर के बीच मौजूद रैखिक संबंधों की ताकत को समझने का एक त्वरित तरीका प्रदान करता है।

R में सहसंबंध मैट्रिक्स बनाने के चार सामान्य तरीके हैं:

विधि 1: कोर फ़ंक्शन (सहसंबंध गुणांक का एक सरल मैट्रिक्स प्राप्त करने के लिए)

 cor(df)

विधि 2: rcorr फ़ंक्शन (सहसंबंध गुणांक के पी-मान प्राप्त करने के लिए)

 library (Hmisc)

rcorr( as.matrix (df))

विधि 3: कॉरप्लॉट फ़ंक्शन (सहसंबंध मैट्रिक्स की कल्पना करने के लिए)

 library (corplot)

corrplot(cor(df))

विधि 4: ggcorrplot फ़ंक्शन (सहसंबंध मैट्रिक्स की कल्पना करने के लिए)

 library (ggcorrplot)

ggcorrplot(cor(df))

निम्नलिखित उदाहरण दिखाते हैं कि आर में निम्नलिखित डेटा फ्रेम के साथ प्रत्येक विधि का उपयोग कैसे करें:

 #create data frame
df <- data. frame (assists=c(4, 5, 5, 6, 7, 8, 8, 10),
                 rebounds=c(12, 14, 13, 7, 8, 8, 9, 13),
                 points=c(22, 24, 26, 26, 29, 32, 20, 14))

#view data frame
df

  assists rebound points
1 4 12 22
2 5 14 24
3 5 13 26
4 6 7 26
5 7 8 29
6 8 8 32
7 8 9 20
8 10 13 14

उदाहरण 1: कोर फ़ंक्शन

हम सहसंबंध मैट्रिक्स बनाने के लिए आर बेस कोर() फ़ंक्शन का उपयोग कर सकते हैं जो हमारे डेटा फ्रेम में प्रत्येक चर के बीच सहसंबंध गुणांक दिखाता है:

 #create correlation matrix
cor(df)

            assists rebound points
assists 1.0000000 -0.2448608 -0.3295730
rebounds -0.2448608 1.0000000 -0.5220917
points -0.3295730 -0.5220917 1.0000000

तालिका के विकर्ण के साथ सहसंबंध गुणांक सभी 1 के बराबर हैं क्योंकि प्रत्येक चर स्वयं के साथ पूरी तरह से सहसंबद्ध है।

अन्य सभी सहसंबंध गुणांक चर के विभिन्न जोड़ीवार संयोजनों के बीच सहसंबंध को दर्शाते हैं। उदाहरण के लिए:

  • सहायता और रिबाउंड के बीच सहसंबंध गुणांक -0.245 है।
  • सहायता और अंक के बीच सहसंबंध गुणांक -0.330 है।
  • रिबाउंड और पॉइंट के बीच सहसंबंध गुणांक -0.522 है।

उदाहरण 2: rcorr फ़ंक्शन

हम एक सहसंबंध मैट्रिक्स बनाने के लिए R में Hmisc पैकेज से rcorr() फ़ंक्शन का उपयोग कर सकते हैं जो हमारे डेटा फ्रेम में प्रत्येक चर के बीच सहसंबंध गुणांक दिखाता है:

 library (Hmisc)

#create matrix of correlation coefficients and p-values
rcorr( as.matrix (df))

         assists rebound points
assists 1.00 -0.24 -0.33
rebounds -0.24 1.00 -0.52
points -0.33 -0.52 1.00

n=8 

P
         assists rebound points
assists 0.5589 0.4253
rebounds 0.5589 0.1844
points 0.4253 0.1844

पहला मैट्रिक्स चरों के बीच सहसंबंध गुणांक दिखाता है और दूसरा मैट्रिक्स संबंधित पी-मान दिखाता है।

उदाहरण के लिए, सहायता और रिबाउंड के बीच सहसंबंध गुणांक -0.24 है और इस सहसंबंध गुणांक का पी-मान 0.5589 है।

यह हमें बताता है कि दो चरों के बीच सहसंबंध नकारात्मक है लेकिन यह सांख्यिकीय रूप से महत्वपूर्ण सहसंबंध नहीं है क्योंकि पी-मान 0.05 से कम नहीं है।

उदाहरण 3: कॉरप्लॉट फ़ंक्शन

सहसंबंध मैट्रिक्स को देखने के लिए हम R में corrplot पैकेज से corrplot() फ़ंक्शन का उपयोग कर सकते हैं:

 library (corplot)

#visualize correlation matrix
corrplot(cor(df))

सहसंबंध मैट्रिक्स में वृत्तों का रंग और आकार हमें प्रत्येक चर के बीच सहसंबंधों की कल्पना करने में मदद करते हैं।

उदाहरण के लिए, वह वृत्त जहां सहायता और रिबाउंड चर प्रतिच्छेद करते हैं वह छोटा और हल्का लाल है, जो हमें बताता है कि सहसंबंध कमजोर और नकारात्मक है।

उदाहरण 4: कॉरप्लॉट फ़ंक्शन

सहसंबंध मैट्रिक्स को देखने के लिए हम R में ggcorrplot पैकेज से ggcorrplot() फ़ंक्शन का उपयोग कर सकते हैं:

 library (ggcorrplot)

#visualize correlation matrix
ggcorrplot(cor(df))

सहसंबंध मैट्रिक्स में वर्गों का रंग हमें प्रत्येक चर के बीच सहसंबंधों की कल्पना करने में मदद करता है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

आर में स्पीयरमैन रैंक सहसंबंध की गणना कैसे करें
आर में आंशिक सहसंबंध की गणना कैसे करें
आर में स्लाइडिंग सहसंबंध की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *