अंतराल बनाम अंतरचतुर्थक सीमा: क्या अंतर है?


आंकड़ों में, अंतराल और इंटरक्वेर्टाइल रेंज डेटा सेट में मूल्यों के वितरण को मापने के दो तरीके हैं।

रेंज किसी डेटा सेट में न्यूनतम मान और अधिकतम मान के बीच अंतर को मापती है।

अंतरचतुर्थक श्रेणी डेटा सेट में पहले चतुर्थक (25वें प्रतिशतक) और तीसरे चतुर्थक (75वें प्रतिशतक) के बीच अंतर को मापती है। यह मध्य 50% मूल्यों के वितरण का प्रतिनिधित्व करता है।

उदाहरण: अंतराल और अंतरचतुर्थक सीमा की गणना कैसे करें

मान लीजिए हमारे पास निम्नलिखित डेटा सेट है:

डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

हम सीमा की गणना करने के लिए निम्नलिखित चरणों का उपयोग कर सकते हैं:

  • रेंज = अधिकतम मूल्य – न्यूनतम मूल्य
  • रेंज = 32 – 1
  • रेंज = 31

हम अंतरचतुर्थक श्रेणी कैलकुलेटर का उपयोग करके अंतरचतुर्थक श्रेणी की गणना करने में मदद कर सकते हैं:

  • अंतरचतुर्थक पैमाना = तीसरा चतुर्थक – पहला चतुर्थक
  • अंतरचतुर्थक पैमाना = 26.5 – 12
  • अंतरचतुर्थक सीमा = 14.5

रेंज हमें डेटासेट का वितरण बताती है जबकि इंटरक्वेर्टाइल रेंज हमें डेटासेट के मध्य भाग का वितरण बताती है।

अंतराल बनाम अंतरचतुर्थक सीमा

रेंज और अंतरचतुर्थक रेंज: समानताएं और अंतर

अंतराल और अंतरचतुर्थक सीमा निम्नलिखित समानता साझा करती है:

  • दोनों मेट्रिक्स डेटा सेट में मानों के वितरण को मापते हैं।

हालाँकि, अंतराल और अंतरचतुर्थक सीमा में निम्नलिखित अंतर है:

  • रेंज हमें डेटा सेट में सबसे बड़े और सबसे छोटे मान के बीच का अंतर बताती है।
  • इंटरक्वेर्टाइल रेंज हमें डेटासेट में मध्य 50% मानों का वितरण बताती है।

अंतराल बनाम इंटरक्वेर्टाइल रेंज: प्रत्येक का उपयोग कब करें

जब हम किसी डेटा सेट में सबसे बड़े और सबसे छोटे मानों के बीच अंतर समझना चाहते हैं तो हमें रेंज का उपयोग करने की आवश्यकता होती है।

उदाहरण के लिए, मान लीजिए कि एक प्रोफेसर 100 छात्रों को परीक्षा देता है। वह कक्षा में सभी छात्रों द्वारा प्राप्त उच्चतम और निम्नतम अंकों के बीच अंतर को समझने के लिए पैमाने का उपयोग कर सकती है।

इसके विपरीत, जब हम किसी डेटा सेट के 75वें प्रतिशतक और 25वें प्रतिशतक के बीच के अंतर को समझना चाहते हैं तो हमें इंटरक्वेर्टाइल रेंज का उपयोग करना चाहिए।

उदाहरण के लिए, यदि कोई प्रोफेसर 100 छात्रों के लिए एक परीक्षा आयोजित करता है, तो वह 75वें प्रतिशतक पर स्कोर करने वाले छात्र और 25वें प्रतिशतक पर स्कोर करने वाले छात्र के बीच परीक्षा स्कोर में अंतर को तुरंत समझने के लिए इंटरक्वेर्टाइल रेंज का उपयोग कर सकता है।

यह ध्यान दिया जाना चाहिए कि हमें डेटा सेट में मूल्यों के वितरण का वर्णन करने के लिए अंतराल या इंटरक्वेर्टाइल रेंज का उपयोग करने के बीच चयन नहीं करना है।

हम दोनों मेट्रिक्स का उपयोग कर सकते हैं क्योंकि वे हमें पूरी तरह से अलग जानकारी प्रदान करते हैं।

समुद्र तट का उपयोग करने के पीछे

रेंज में एक खामी है: यह आउटलेर्स से प्रभावित है

इसे स्पष्ट करने के लिए, निम्नलिखित डेटासेट पर विचार करें:

डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

इस डेटासेट की सीमा 32 – 1 = 31 है।

हालाँकि, इस बात पर विचार करें कि क्या डेटासेट में अत्यधिक भिन्नता थी:

डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

इस डेटासेट की सीमा अब 378 – 1 = 377 होगी।

ध्यान दें कि बाहरी प्रभाव के कारण सीमा में भारी परिवर्तन कैसे होता है।

डेटा सेट की सीमा की गणना करने से पहले, यह जांचना एक अच्छा विचार है कि क्या कोई आउटलेयर हैं जो सीमा को भ्रामक बना सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल इंटरक्वेर्टाइल रेंज के बारे में अतिरिक्त जानकारी प्रदान करते हैं:

अंतरचतुर्थक श्रेणी की व्याख्या कैसे करें
इंटरक्वेर्टाइल रेंज का उपयोग करके आउटलेर्स का पता कैसे लगाएं
एक्सेल में इंटरक्वेर्टाइल रेंज की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *