रेंज बनाम मानक विचलन: प्रत्येक का उपयोग कब करें
रेंज और मानक विचलन डेटा सेट में मूल्यों के वितरण को मापने के दो तरीके हैं।
सीमा किसी डेटा सेट में न्यूनतम मान और अधिकतम मान के बीच अंतर को दर्शाती है।
मानक विचलन माध्य मान से व्यक्तिगत मानों के विशिष्ट विचलन को मापता है। इसकी गणना इस प्रकार की जाती है:
s = √(Σ(x i – x ) 2 / (n-1))
सोना:
- Σ: एक प्रतीक जिसका अर्थ है “योग”
- x i : नमूने में iवें अवलोकन का मान
- x : नमूना का मतलब है
- n: नमूना आकार
उदाहरण के लिए, मान लें कि हमारे पास निम्नलिखित डेटा सेट है:
डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
सीमा की गणना इस प्रकार की जाती है: 31 -1 = 32.
हम यह जानने के लिए कैलकुलेटर का उपयोग कर सकते हैं कि मानक विचलन 9.25 है।
रेंज और मानक विचलन: समानताएं और अंतर
रेंज और मानक विचलन निम्नलिखित समानता साझा करते हैं:
- दोनों मेट्रिक्स डेटा सेट में मानों के वितरण को मापते हैं।
हालाँकि, सीमा और मानक विचलन में निम्नलिखित अंतर है:
- रेंज हमें डेटा सेट में सबसे बड़े और सबसे छोटे मान के बीच का अंतर बताती है।
- मानक विचलन हमें डेटा सेट के औसत मूल्य से व्यक्तिगत मूल्यों का विशिष्ट विचलन बताता है।
रेंज बनाम मानक विचलन: प्रत्येक का उपयोग कब करें
जब हम किसी डेटा सेट में सबसे बड़े और सबसे छोटे मानों के बीच अंतर समझना चाहते हैं तो हमें रेंज का उपयोग करने की आवश्यकता होती है।
उदाहरण के लिए, मान लीजिए कि एक प्रोफेसर 100 छात्रों को परीक्षा देता है। वह कक्षा में सभी छात्रों द्वारा प्राप्त उच्चतम और निम्नतम अंकों के बीच अंतर को समझने के लिए पैमाने का उपयोग कर सकती है।
इसके विपरीत, हमें मानक विचलन का उपयोग तब करना चाहिए जब हम यह समझना चाहते हैं कि किसी डेटा सेट का विशिष्ट मूल्य औसत मूल्य से कितनी दूर तक विचलित होता है।
उदाहरण के लिए, यदि कोई प्रोफेसर 100 छात्रों के लिए एक परीक्षा आयोजित करता है, तो वह यह निर्धारित करने के लिए मानक विचलन का उपयोग कर सकता है कि सामान्य परीक्षा स्कोर औसत परीक्षा स्कोर से कितना विचलित होता है।
यह ध्यान देने योग्य है कि हमें डेटा सेट में मूल्यों के वितरण का वर्णन करने के लिए सीमा या मानक विचलन का उपयोग करने के बीच चयन नहीं करना है। हम दोनों मेट्रिक्स का उपयोग कर सकते हैं क्योंकि वे हमें पूरी तरह से अलग जानकारी प्रदान करते हैं।
रेंज और मानक विचलन के नुकसान
रेंज और मानक विचलन दोनों में एक खामी है: वे दोनों आउटलेर्स से प्रभावित हैं ।
इसे स्पष्ट करने के लिए, निम्नलिखित डेटासेट पर विचार करें:
डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
हम इस डेटासेट की सीमा और मानक विचलन के लिए निम्नलिखित मानों की गणना कर सकते हैं:
- रेंज: 31
- मानक विचलन: 9.25
हालाँकि, इस बात पर विचार करें कि क्या डेटासेट में अत्यधिक भिन्नता थी:
डेटासेट: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
हम इस डेटासेट के लिए निम्नलिखित मेट्रिक्स खोजने के लिए एक कैलकुलेटर का उपयोग कर सकते हैं:
- रेंज: 377
- मानक विचलन: 85.02
ध्यान दें कि बाहरी प्रभाव के कारण सीमा और मानक विचलन कैसे महत्वपूर्ण रूप से बदल जाते हैं।
हालाँकि डेटा सेट में मूल्यों के वितरण का अंदाजा लगाने के लिए सीमा और मानक विचलन उपयोगी उपाय हो सकते हैं, आपको पहले यह सुनिश्चित करना होगा कि डेटा सेट में कोई भी आउटलेर नहीं है जो इन मूल्यों को प्रभावित करता है। पैमाने। अन्यथा, सीमा और मानक विचलन भ्रामक हो सकते हैं।