पांडा हिस्टोग्राम में उपयोग किए गए डिब्बे की संख्या कैसे बदलें
आप पांडा हिस्टोग्राम में उपयोग किए गए डिब्बे की संख्या को बदलने के लिए डिब्बे तर्क का उपयोग कर सकते हैं:
df. plot . hist (columns=[' my_column '], bins= 10 )
पांडा हिस्टोग्राम में प्रयुक्त डिब्बे की डिफ़ॉल्ट संख्या 10 है।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में बिन्स तर्क का उपयोग कैसे करें।
उदाहरण: पांडा हिस्टोग्राम में डिब्बे की संख्या कैसे बदलें
मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न टीमों के बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंकों के बारे में जानकारी है:
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (1) #createDataFrame df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ), ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )}) #view head of DataFrame print ( df.head ()) team points 0 A 23.248691 1 A 18.776487 2 A 18.943656 3 A 17.854063 4 A 21.730815
यदि हम पॉइंट वेरिएबल के मानों के वितरण की कल्पना करने के लिए एक हिस्टोग्राम बनाते हैं, तो पांडा डिफ़ॉल्ट रूप से हिस्टोग्राम में 10 बिन का उपयोग करेगा:
#create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')
ध्यान दें कि हिस्टोग्राम में 10 बार हैं।
हालाँकि, मान लीजिए कि हम डिब्बे की कुल संख्या को 20 में बदलने के लिए डिब्बे तर्क का उपयोग करते हैं:
#create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 )
ध्यान दें कि हिस्टोग्राम में अब 20 बार हैं।
हम कूड़ेदानों की संख्या घटाकर 5 भी कर सकते हैं:
#create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 )
हिस्टोग्राम में अब कुल 5 बार हैं।
आप जो सटीक हिस्टोग्राम चाहते हैं उसे बनाने के लिए बिन्स तर्क के मान को समायोजित करने के लिए स्वतंत्र महसूस करें।
हालाँकि, कूड़ेदानों की संख्या चुनते समय निम्नलिखित बातों को ध्यान में रखें:
- यदि आप बहुत कम श्रेणियां चुनते हैं, तो डेटा का वास्तविक अंतर्निहित पैटर्न छिपाया जा सकता है।
- यदि आप बहुत अधिक श्रेणियां चुनते हैं, तो आपको डेटा में केवल शोर दिखाई दे सकता है।
हिस्टोग्राम में उपयोग करने के लिए डिब्बे की इष्टतम संख्या निर्धारित करने का एक उपयोगी तरीका स्टर्गेस नियम का उपयोग करना है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:
पांडास डेटाफ़्रेम से हिस्टोग्राम कैसे बनाएं
पांडा श्रृंखला से हिस्टोग्राम कैसे बनाएं
पंडों में समूह द्वारा हिस्टोग्राम कैसे बनाएं