पांडा में कॉलम मानों के वितरण को कैसे प्लॉट करें


आप पांडा डेटाफ़्रेम में कॉलम मानों के वितरण को प्लॉट करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:

विधि 1: मानों के वितरण को एक कॉलम में प्लॉट करें

 df[' my_column ']. plot (kind=' kde ')

विधि 2: एक कॉलम में मानों के वितरण को दूसरे कॉलम द्वारा समूहीकृत करके प्लॉट करें

 df. groupby (' group_column ')[' values_column ']. plot (kind=' kde ')

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                            'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 
                              8, 7, 8, 9, 12, 12, 12, 14, 15, 17]})

#view DataFrame
print (df)

   team points
0 to 3
1 to 3
2 to 4
3 to 5
4 to 4
5 TO 7
6 to 7
7 to 7
8 to 10
9 to 11
10 B 8
11 B 7
12 B 8
13 B 9
14 B 12
15 B 12
16 B 12
17 B 14
18 B 15
19 B 17

उदाहरण 1: एक कॉलम में मानों के वितरण को प्लॉट करें

निम्नलिखित कोड दिखाता है कि अंक कॉलम में मूल्यों के वितरण को कैसे प्लॉट किया जाए:

 #plot distribution of values in points column
df[' points ']. plot (kind=' kde ')

ध्यान दें कि type=’kde’ पांडा को कर्नेल घनत्व अनुमान का उपयोग करने के लिए कहता है, जो एक सहज वक्र उत्पन्न करता है जो एक चर के मूल्यों के वितरण को सारांशित करता है।

यदि आप इसके बजाय एक हिस्टोग्राम बनाना चाहते हैं, तो आप type=’hist’ को निम्नानुसार निर्दिष्ट कर सकते हैं:

 #plot distribution of values in points column using histogram
df[' points ']. plot (kind=' hist ', edgecolor=' black ') 

यह विधि बिंदुओं के कॉलम में मानों की आवृत्तियों को दर्शाने के लिए बार का उपयोग करती है, एक चिकनी रेखा के विपरीत जो वितरण के आकार को सारांशित करती है।

उदाहरण 2: एक कॉलम में मानों के वितरण को दूसरे कॉलम द्वारा समूहीकृत करके प्लॉट करें

निम्नलिखित कोड दिखाता है कि टीम कॉलम द्वारा समूहीकृत, अंक कॉलम में मूल्यों के वितरण को कैसे प्लॉट किया जाए:

 import matplotlib.pyplot as plt

#plot distribution of points by team 
df. groupby (' team ')[' points ']. plot (kind=' kde ')

#add legend
plt. legend ([' A ',' B '], title=' Team ')

#add x-axis label
plt. xlabel (' Points ')

नीली रेखा टीम ए के खिलाड़ियों के अंक वितरण को दर्शाती है जबकि नारंगी रेखा टीम बी के खिलाड़ियों के अंक वितरण को दर्शाती है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा में प्लॉट में शीर्षक कैसे जोड़ें
पांडा प्लॉट के आकृति आकार को कैसे समायोजित करें
सबप्लॉट्स में एकाधिक पांडा डेटाफ़्रेम कैसे प्लॉट करें
पांडा में प्लॉट लेजेंड्स कैसे बनाएं और कस्टमाइज़ करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *