आर में हिस्टोग्राम ब्रेक कैसे निर्दिष्ट करें (उदाहरण के साथ)
डिफ़ॉल्ट रूप से, आर में हिस्ट () फ़ंक्शन हिस्टोग्राम में उपयोग करने के लिए डिब्बे की संख्या निर्धारित करने के लिए स्टर्जेस नियम का उपयोग करता है।
हिस्टोग्राम में उपयोग करने के लिए समूहों की इष्टतम संख्या निर्धारित करने के लिए स्टर्गेस का नियम निम्नलिखित सूत्र का उपयोग करता है:
इष्टतम डिब्बे = ⌈लॉग 2 एन + 1⌉
सोना:
- n: डेटासेट में अवलोकनों की कुल संख्या।
- ⌈ ⌉: प्रतीक जिसका अर्थ है “छत”, अर्थात उत्तर को निकटतम पूर्ण संख्या में पूर्णांकित करना।
उदाहरण के लिए, यदि किसी डेटा सेट में 31 अवलोकन हैं, तो स्टर्ज का नियम हिस्टोग्राम में उपयोग करने के लिए समूहों की इष्टतम संख्या निर्धारित करने के लिए निम्नलिखित सूत्र का उपयोग करेगा:
इष्टतम डिब्बे = ⌈लॉग 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 ।
स्टर्गेस के नियम के अनुसार, हमें इस डेटा सेट को देखने के लिए हिस्टोग्राम में 6 बक्सों का उपयोग करना चाहिए।
यदि आप आर में हिस्ट () फ़ंक्शन का उपयोग करते हैं, तो हिस्टोग्राम में प्रदर्शित करने के लिए डिब्बे की संख्या को स्वचालित रूप से चुनने के लिए स्टर्गेस नियम का उपयोग किया जाएगा।
hist(data)
भले ही आप उपयोग करने के लिए अलग-अलग संख्या में डिब्बे निर्दिष्ट करने के लिए ब्रेक तर्क का उपयोग करते हैं, आर इसे केवल “सुझाव” के रूप में उपयोग करेगा कि कितने डिब्बे का उपयोग करना है।
hist(data, breaks= 7 )
हालाँकि, आप R को हिस्टोग्राम में विशिष्ट संख्या में बक्सों का उपयोग करने के लिए बाध्य करने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
#create histogram with 7 bins hist(data, breaks = seq(min(data), max(data), length. out = 8 ))
ध्यान दें : आपको length.out के लिए n+1 की लंबाई का उपयोग करना होगा जहां n आपके इच्छित डिब्बे की संख्या है।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस कोड का उपयोग कैसे करें।
उदाहरण: आर में हिस्टोग्राम ब्रेक निर्दिष्ट करना
मान लीजिए कि हमारे पास R में 16 मानों के साथ निम्नलिखित डेटा सेट है:
#create vector of 16 values
data <- c(2, 3, 3, 3, 4, 4, 5, 6, 8, 10, 12, 14, 15, 18, 20, 21)
यदि हम हिस्ट() फ़ंक्शन का उपयोग करते हैं, तो आर 5 डिब्बे के साथ निम्नलिखित हिस्टोग्राम बनाएगा:
#create histogram
hist(data)
ध्यान दें : आर ने यह निर्धारित करने के लिए स्टर्जेस नियम का उपयोग किया कि 16 अवलोकनों के साथ डेटा सेट की कल्पना करने के लिए 5 समूह समूहों की इष्टतम संख्या थी।
यदि हम हिस्टोग्राम में उपयोग करने के लिए 7 समूहों को निर्दिष्ट करने के लिए ब्रेक तर्क का उपयोग करने का प्रयास करते हैं, तो आर इसे केवल “सुझाव” के रूप में लेगा और इसके बजाय 10 समूहों का उपयोग करना चुनेगा:
#attempt to create histogram with 7 bins
hist(data, breaks= 7 )
हालाँकि, हम R को हिस्टोग्राम में 7 बिन्स का उपयोग करने के लिए बाध्य करने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
#create histogram with 7 bins
hist(data, breaks = seq(min(data), max(data), length. out = 8 ))
ध्यान दें कि परिणाम 7 समान दूरी वाले बक्सों वाला एक हिस्टोग्राम है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ऑपरेशन कैसे करें:
आर में सापेक्ष आवृत्ति हिस्टोग्राम कैसे बनाएं
आर में एकाधिक हिस्टोग्राम कैसे प्लॉट करें