पायथन में सहसंबंध मैट्रिक्स कैसे बनाएं


दो चरों के बीच संबंध को मापने का एक तरीका पियर्सन सहसंबंध गुणांक का उपयोग करना है, जो दो चरों के बीच रैखिक संबंध का एक माप है

यह -1 और 1 के बीच का मान लेता है जहां:

  • -1 पूर्णतः नकारात्मक रैखिक सहसंबंध दर्शाता है।
  • 0 कोई रैखिक सहसंबंध नहीं दर्शाता है।
  • 1 पूर्णतः सकारात्मक रैखिक सहसंबंध दर्शाता है।

सहसंबंध गुणांक शून्य से जितना अधिक होगा, दोनों चरों के बीच संबंध उतना ही मजबूत होगा।

लेकिन कुछ मामलों में, हम चरों के अनेक युग्मों के बीच संबंध को समझना चाहते हैं। इन मामलों में, हम एक सहसंबंध मैट्रिक्स बना सकते हैं, जो एक वर्गाकार तालिका है जो चर के कई जोड़ीदार संयोजनों के बीच सहसंबंध गुणांक दिखाती है।

यह ट्यूटोरियल बताता है कि पायथन में सहसंबंध मैट्रिक्स कैसे बनाएं और व्याख्या करें।

पायथन में सहसंबंध मैट्रिक्स कैसे बनाएं

पायथन में सहसंबंध मैट्रिक्स बनाने के लिए निम्नलिखित चरणों का उपयोग करें।

चरण 1: डेटासेट बनाएं।

 import pandas as pd

data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10],
        'rebounds': [12, 14, 13, 7, 8, 8, 9, 13],
        'points': [22, 24, 26, 26, 29, 32, 20, 14]
        }

df = pd. DataFrame (data, columns=['assists','rebounds','points'])
df

   assist rebound points
0 4 12 22
1 5 14 24
2 5 13 26
3 6 7 26
4 7 8 29
5 8 8 32
6 8 9 20
7 10 13 14

चरण 2: सहसंबंध मैट्रिक्स बनाएं।

 #create correlation matrix
df. corr ()

                assists rebound points
assists 1.000000 -0.244861 -0.329573
rebounds -0.244861 1.000000 -0.522092
points -0.329573 -0.522092 1.000000

#create same correlation matrix with coefficients rounded to 3 decimals 
df. corr (). round (3)
	       assists rebound points
assists 1.000 -0.245 -0.330
rebounds -0.245 1.000 -0.522
points -0.330 -0.522 1.000

चरण 3: सहसंबंध मैट्रिक्स की व्याख्या करें।

तालिका के विकर्ण के साथ सहसंबंध गुणांक सभी 1 के बराबर हैं क्योंकि प्रत्येक चर स्वयं के साथ पूरी तरह से सहसंबद्ध है।

अन्य सभी सहसंबंध गुणांक चर के विभिन्न जोड़ीवार संयोजनों के बीच सहसंबंध को दर्शाते हैं। उदाहरण के लिए:

  • सहायता और रिबाउंड के बीच सहसंबंध गुणांक -0.245 है।
  • सहायता और अंक के बीच सहसंबंध गुणांक -0.330 है।
  • रिबाउंड और पॉइंट के बीच सहसंबंध गुणांक -0.522 है।

चरण 4: सहसंबंध मैट्रिक्स की कल्पना करें (वैकल्पिक)।

आप पांडा में उपलब्ध स्टाइलिंग विकल्पों का उपयोग करके सहसंबंध मैट्रिक्स की कल्पना कर सकते हैं:

 corr = df. corr ()
corr. style . background_gradient (cmap='coolwarm')

पायथन में सहसंबंध मैट्रिक्स

आप विभिन्न रंगों के साथ सहसंबंध मैट्रिक्स बनाने के लिए सीएमएपी तर्क को भी संशोधित कर सकते हैं।

 corr = df. corr ()
corr. style . background_gradient (cmap=' RdYlGn ') 

पायथन में matplotlib के साथ सहसंबंध मैट्रिक्स

 corr = df. corr ()
corr. style . background_gradient (cmap=' bwr ') 

पंडों का उपयोग करते हुए सहसंबंध मैट्रिक्स

 corr = df. corr ()
corr. style . background_gradient (cmap=' PuOr ') 

पायथन में सहसंबंध मैट्रिक्स उदाहरण

नोट : सीएमएपी तर्कों की पूरी सूची के लिए, matplotlib दस्तावेज़ देखें।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *