पांडा हिस्टोग्राम में उपयोग किए गए डिब्बे की संख्या कैसे बदलें


आप पांडा हिस्टोग्राम में उपयोग किए गए डिब्बे की संख्या को बदलने के लिए डिब्बे तर्क का उपयोग कर सकते हैं:

 df. plot . hist (columns=[' my_column '], bins= 10 )

पांडा हिस्टोग्राम में प्रयुक्त डिब्बे की डिफ़ॉल्ट संख्या 10 है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में बिन्स तर्क का उपयोग कैसे करें।

उदाहरण: पांडा हिस्टोग्राम में डिब्बे की संख्या कैसे बदलें

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न टीमों के बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंकों के बारे में जानकारी है:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ),
                   ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )})

#view head of DataFrame
print ( df.head ())

  team points
0 A 23.248691
1 A 18.776487
2 A 18.943656
3 A 17.854063
4 A 21.730815

यदि हम पॉइंट वेरिएबल के मानों के वितरण की कल्पना करने के लिए एक हिस्टोग्राम बनाते हैं, तो पांडा डिफ़ॉल्ट रूप से हिस्टोग्राम में 10 बिन का उपयोग करेगा:

 #create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')

ध्यान दें कि हिस्टोग्राम में 10 बार हैं।

हालाँकि, मान लीजिए कि हम डिब्बे की कुल संख्या को 20 में बदलने के लिए डिब्बे तर्क का उपयोग करते हैं:

 #create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 ) 

पांडा हिस्टोग्राम में डिब्बे की संख्या बढ़ाते हैं

ध्यान दें कि हिस्टोग्राम में अब 20 बार हैं।

हम कूड़ेदानों की संख्या घटाकर 5 भी कर सकते हैं:

 #create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 ) 

पांडा हिस्टोग्राम में डिब्बे की संख्या कम कर देते हैं

हिस्टोग्राम में अब कुल 5 बार हैं।

आप जो सटीक हिस्टोग्राम चाहते हैं उसे बनाने के लिए बिन्स तर्क के मान को समायोजित करने के लिए स्वतंत्र महसूस करें।

हालाँकि, कूड़ेदानों की संख्या चुनते समय निम्नलिखित बातों को ध्यान में रखें:

  • यदि आप बहुत कम श्रेणियां चुनते हैं, तो डेटा का वास्तविक अंतर्निहित पैटर्न छिपाया जा सकता है।
  • यदि आप बहुत अधिक श्रेणियां चुनते हैं, तो आपको डेटा में केवल शोर दिखाई दे सकता है।

हिस्टोग्राम में उपयोग करने के लिए डिब्बे की इष्टतम संख्या निर्धारित करने का एक उपयोगी तरीका स्टर्गेस नियम का उपयोग करना है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडास डेटाफ़्रेम से हिस्टोग्राम कैसे बनाएं
पांडा श्रृंखला से हिस्टोग्राम कैसे बनाएं
पंडों में समूह द्वारा हिस्टोग्राम कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *