Ggplot2 में हिस्टोग्राम के लिए डिब्बे की संख्या कैसे निर्धारित करें
आप ggplot2 में हिस्टोग्राम में उपयोग किए जाने वाले डिब्बे की संख्या निर्दिष्ट करने के लिए बिन्स तर्क का उपयोग कर सकते हैं:
library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 )
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस तर्क का उपयोग कैसे किया जाए।
उदाहरण: ggplot2 में हिस्टोग्राम के लिए डिब्बे की संख्या निर्धारित करें
निम्नलिखित कोड दिखाता है कि R में 10,000 यादृच्छिक मानों वाला एक डेटासेट कैसे बनाया जाए जो 2 के औसत मान के साथ पॉइसन वितरण का अनुसरण करता है:
#make this example reproducible
set. seeds (0)
#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))
#view first five rows of data frame
head(df)
values
1 4
2 1
3 1
4 2
5 4
6 1
हम डेटा फ़्रेम में मानों के वितरण की कल्पना करने के लिए ggplot2 में हिस्टोग्राम बनाने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ')
डिफ़ॉल्ट रूप से, ggplot2 हिस्टोग्राम में उपयोग करने के लिए स्वचालित रूप से एक निश्चित संख्या में बॉक्स का चयन करेगा।
हालाँकि, हम यह निर्दिष्ट करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं कि हम चाहते हैं कि हिस्टोग्राम 10 डिब्बे का उपयोग करे:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 10 )
ध्यान दें कि हिस्टोग्राम में अब ठीक 10 बॉक्स हैं।
या हम यह निर्दिष्ट करने के लिए निम्नलिखित वाक्यविन्यास का उपयोग कर सकते हैं कि हम चाहते हैं कि हिस्टोग्राम 5 डिब्बे का उपयोग करे:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 5 )
ध्यान दें कि हिस्टोग्राम में अब ठीक 5 बॉक्स हैं।
आप पाएंगे कि आप जितने कम कूड़ेदानों का उपयोग करेंगे, प्रत्येक कूड़ादान उतना ही चौड़ा होगा।
सामान्य तौर पर, यदि आप बहुत कम समूहों का उपयोग करते हैं, तो मूल्यों का वास्तविक अंतर्निहित वितरण छिपा रहेगा।
हालाँकि, यदि आप बहुत सारे समूहों का उपयोग करते हैं, तो आप डेटा में केवल शोर देखने का जोखिम उठाते हैं।
हिस्टोग्राम में उपयोग करने के लिए डिब्बे की इष्टतम संख्या खोजने का एक तरीका स्टर्गेस नियम का उपयोग करना है। इस नियम के बारे में यहां और जानें.
नोट : आप यहां जियोम_हिस्टोग्राम फ़ंक्शन के लिए पूर्ण दस्तावेज़ पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ग्राफ़ कैसे बनाएं:
आर में सापेक्ष आवृत्ति हिस्टोग्राम कैसे बनाएं
आर में एक ही ग्राफ़ में एकाधिक बॉक्सप्लॉट कैसे प्लॉट करें
R में एक ग्राफ़ में एकाधिक पंक्तियाँ कैसे प्लॉट करें