सहसंबंध गुणांक के साथ सीबॉर्न स्कैटर प्लॉट कैसे बनाएं
आप सीबॉर्न में स्कैटरप्लॉट बनाने और प्लॉट में सहसंबंध गुणांक जोड़ने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:
import scipy import matplotlib. pyplot as plt import seaborn as sns #calculate correlation coefficient between x and y r = scipy. stats . pearsonr (x=df. x , y=df. y )[0] #create scatterplot sns. scatterplot (data=df, x=df. x , y=df. y ) #add correlation coefficient to plot plt. text (5, 30, ' r = ' + str ( round (r,2)))
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: सहसंबंध गुणांक के साथ एक सीबॉर्न स्कैटरप्लॉट बनाएं
मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जो विभिन्न बास्केटबॉल खिलाड़ियों के अंक और सहायता दिखाता है:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'C', 'C', 'C', 'D', 'D'], ' points ': [12, 11, 18, 15, 14, 20, 25, 24, 32, 30], ' assists ': [4, 7, 7, 8, 9, 10, 10, 12, 10, 15]}) #view DataFrame print (df) team points assists 0 to 12 4 1 to 11 7 2 To 18 7 3 to 15 8 4 B 14 9 5 C 20 10 6 C 25 10 7 C 24 12 8 D 32 10 9 D 30 15
हम पास और बिंदुओं के बीच संबंध को देखने के लिए स्कैटरप्लॉट बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं और इन दो चर के बीच सहसंबंध गुणांक की गणना करने के लिए scipy के pearsonr() फ़ंक्शन का भी उपयोग कर सकते हैं:
import scipy import matplotlib. pyplot as plt import seaborn as sns #calculate correlation coefficient between assists and points r = scipy. stats . pearsonr (x=df. assists , y=df. points )[0] #create scatterplot sns. scatterplot (data=df, x=df. assists , y=df. points ) #add correlation coefficient to plot plt. text (5, 30, ' r = ' + str ( round (r,2)))
परिणाम से, हम देख सकते हैं कि सहायता और अंकों के बीच पियर्सन सहसंबंध गुणांक 0.78 है।
संबंधित: “मजबूत” सहसंबंध क्या माना जाता है?
ध्यान दें कि हमने सहसंबंध गुणांक को दो दशमलव स्थानों तक पूर्णांकित करने के लिए राउंड() फ़ंक्शन का उपयोग किया था।
दशमलव स्थानों की एक अलग संख्या में पूर्णांक बनाने के लिए स्वतंत्र महसूस करें और प्लॉट पर सहसंबंध गुणांक के फ़ॉन्ट आकार को बदलने के लिए फॉन्टसाइज तर्क का उपयोग करने के लिए स्वतंत्र महसूस करें:
import scipy import matplotlib. pyplot as plt import seaborn as sns #calculate correlation coefficient between assists and points r = scipy. stats . pearsonr (x=df. assists , y=df. points )[0] #create scatterplot sns. scatterplot (data=df, x=df. assists , y=df. points ) #add correlation coefficient to plot plt. text (5, 30, ' r= '+ str ( round (r,4)), fontsize= 20 ))
ध्यान दें कि सहसंबंध गुणांक अब चार दशमलव स्थानों तक पूर्णांकित है और फ़ॉन्ट का आकार पिछले उदाहरण की तुलना में बहुत बड़ा है।
नोट : आप सीबॉर्न स्कैटरप्लॉट() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ यहां पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि सीबॉर्न में अन्य सामान्य कार्य कैसे करें:
सीबॉर्न में वितरण कैसे प्लॉट करें
सीबॉर्न में एक्स-अक्ष पर बॉक्सप्लॉट कैसे ऑर्डर करें
सीबॉर्न प्लॉट में टेबल कैसे जोड़ें