सहसंबंध गुणांक के साथ सीबॉर्न स्कैटर प्लॉट कैसे बनाएं


आप सीबॉर्न में स्कैटरप्लॉट बनाने और प्लॉट में सहसंबंध गुणांक जोड़ने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 import scipy
import matplotlib. pyplot as plt
import seaborn as sns

#calculate correlation coefficient between x and y
r = scipy. stats . pearsonr (x=df. x , y=df. y )[0]

#create scatterplot
sns. scatterplot (data=df, x=df. x , y=df. y )

#add correlation coefficient to plot
plt. text (5, 30, ' r = ' + str ( round (r,2)))

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: सहसंबंध गुणांक के साथ एक सीबॉर्न स्कैटरप्लॉट बनाएं

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जो विभिन्न बास्केटबॉल खिलाड़ियों के अंक और सहायता दिखाता है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'C', 'C', 'C', 'D', 'D'],
                   ' points ': [12, 11, 18, 15, 14, 20, 25, 24, 32, 30],
                   ' assists ': [4, 7, 7, 8, 9, 10, 10, 12, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 4
1 to 11 7
2 To 18 7
3 to 15 8
4 B 14 9
5 C 20 10
6 C 25 10
7 C 24 12
8 D 32 10
9 D 30 15

हम पास और बिंदुओं के बीच संबंध को देखने के लिए स्कैटरप्लॉट बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं और इन दो चर के बीच सहसंबंध गुणांक की गणना करने के लिए scipy के pearsonr() फ़ंक्शन का भी उपयोग कर सकते हैं:

 import scipy
import matplotlib. pyplot as plt
import seaborn as sns

#calculate correlation coefficient between assists and points
r = scipy. stats . pearsonr (x=df. assists , y=df. points )[0]

#create scatterplot
sns. scatterplot (data=df, x=df. assists , y=df. points )

#add correlation coefficient to plot
plt. text (5, 30, ' r = ' + str ( round (r,2))) 

सहसंबंध गुणांक के साथ समुद्री बिंदु बादल

परिणाम से, हम देख सकते हैं कि सहायता और अंकों के बीच पियर्सन सहसंबंध गुणांक 0.78 है।

संबंधित: “मजबूत” सहसंबंध क्या माना जाता है?

ध्यान दें कि हमने सहसंबंध गुणांक को दो दशमलव स्थानों तक पूर्णांकित करने के लिए राउंड() फ़ंक्शन का उपयोग किया था।

दशमलव स्थानों की एक अलग संख्या में पूर्णांक बनाने के लिए स्वतंत्र महसूस करें और प्लॉट पर सहसंबंध गुणांक के फ़ॉन्ट आकार को बदलने के लिए फॉन्टसाइज तर्क का उपयोग करने के लिए स्वतंत्र महसूस करें:

 import scipy
import matplotlib. pyplot as plt
import seaborn as sns

#calculate correlation coefficient between assists and points
r = scipy. stats . pearsonr (x=df. assists , y=df. points )[0]

#create scatterplot
sns. scatterplot (data=df, x=df. assists , y=df. points )

#add correlation coefficient to plot
plt. text (5, 30, ' r= '+ str ( round (r,4)), fontsize= 20 )) 

ध्यान दें कि सहसंबंध गुणांक अब चार दशमलव स्थानों तक पूर्णांकित है और फ़ॉन्ट का आकार पिछले उदाहरण की तुलना में बहुत बड़ा है।

नोट : आप सीबॉर्न स्कैटरप्लॉट() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि सीबॉर्न में अन्य सामान्य कार्य कैसे करें:

सीबॉर्न में वितरण कैसे प्लॉट करें
सीबॉर्न में एक्स-अक्ष पर बॉक्सप्लॉट कैसे ऑर्डर करें
सीबॉर्न प्लॉट में टेबल कैसे जोड़ें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *