सांख्यिकी में रेंज क्यों महत्वपूर्ण है?
आंकड़ों में, रेंज डेटा के एक सेट में सबसे छोटे और सबसे बड़े मान के बीच के अंतर को दर्शाती है।
उदाहरण के लिए, मान लें कि हमारे पास निम्नलिखित डेटा सेट है:
डेटासेट: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26
हम सीमा की गणना के लिए निम्नलिखित सूत्र का उपयोग कर सकते हैं:
- रेंज = अधिकतम मूल्य – न्यूनतम मूल्य
- रेंज = 26 – 3
- रेंज = 23
रेंज 23 है. यह डेटासेट में सबसे छोटे और सबसे बड़े मानों के बीच अंतर को दर्शाता है।
सांख्यिकी में, सीमा निम्नलिखित कारणों से महत्वपूर्ण है:
कारण 1 : यह हमें संपूर्ण डेटा सेट का वितरण बताता है।
कारण 2 : यह हमें बताता है कि किसी दिए गए डेटा सेट में कौन से चरम मान संभव हैं।
निम्नलिखित उदाहरण व्यवहार में इनमें से प्रत्येक कारण को दर्शाते हैं।
कारण 1: रेंज हमें संपूर्ण डेटा सेट का वितरण बताती है
रेंज हमें संपूर्ण डेटा सेट का वितरण बताती है।
उदाहरण के लिए, मान लें कि हमारे पास निम्नलिखित डेटासेट है जो एक कक्षा में 20 विभिन्न छात्रों के परीक्षा स्कोर दिखाता है:
परीक्षा परिणामों की सीमा की गणना निम्नानुसार की जाएगी:
- रेंज = अधिकतम मूल्य – न्यूनतम मूल्य
- रेंज = 98 – 68
- रेंज = 30
सीमा 30 हो जाती है। यह परीक्षा में उच्चतम ग्रेड और कक्षा में निम्नतम ग्रेड के बीच अंतर को दर्शाता है।
इस माप को ठीक से जानने के बाद, कक्षा शिक्षक सभी छात्रों के बीच परीक्षा परिणामों में मूल्यों के वितरण को जल्दी से समझ सकता है।
कारण 2: रेंज हमें बताती है कि किसी दिए गए डेटा सेट में कौन से चरम मान संभव हैं
रेंज हमें बताती है कि किसी दिए गए डेटा सेट में कौन से चरम मान संभव हैं।
उदाहरण के लिए, मान लीजिए कि एक रियल एस्टेट एजेंट के पास संयुक्त राज्य अमेरिका के एक निश्चित शहर में 100,000 घरों की बिक्री कीमतों वाले डेटाबेस तक पहुंच है:
मान लें कि हम इस डेटा सेट की सीमा की गणना करने और निम्नलिखित खोजने के लिए सांख्यिकीय सॉफ़्टवेयर (जैसे एक्सेल , आर , पायथन , आदि) का उपयोग करते हैं:
- रेंज = अधिकतम मूल्य – न्यूनतम मूल्य
- रेंज = 854,000 – 194,000
- रेंज = 660,000
यदि रियल एस्टेट एजेंट के पास कोई ग्राहक है जिसका क्रय बजट $194,000 से कम या $854,000 से अधिक है, तो रियल एस्टेट एजेंट तुरंत जान सकता है कि उस विशेष शहर में कोई भी घर खरीद के मानदंडों को पूरा नहीं करेगा।
समुद्र तट का उपयोग करने के पीछे
रेंज एक नुकसान से ग्रस्त है: यह आउटलेर्स से प्रभावित है ।
इसे स्पष्ट करने के लिए, निम्नलिखित डेटासेट पर विचार करें:
डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
इस डेटासेट की सीमा 32 – 1 = 31 है।
हालाँकि, इस बात पर विचार करें कि क्या डेटासेट में अत्यधिक भिन्नता थी:
डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
इस डेटासेट की सीमा अब 378 – 1 = 377 होगी।
ध्यान दें कि बाहरी प्रभाव के कारण सीमा में भारी परिवर्तन कैसे होता है।
डेटा सेट की सीमा की गणना करने से पहले, यह जांचना एक अच्छा विचार है कि क्या कोई आउटलेयर हैं जो सीमा को भ्रामक बना सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल सांख्यिकी में अन्य उपायों के महत्व को समझाते हैं:
सांख्यिकी में औसत क्यों महत्वपूर्ण है?
सांख्यिकी में माध्यिका क्यों महत्वपूर्ण है?
सांख्यिकी में मोड क्यों महत्वपूर्ण है?
सांख्यिकी में मानक विचलन क्यों महत्वपूर्ण है?