संशोधित z स्कोर क्या है? (परिभाषा & #038; उदाहरण)
आंकड़ों में, एक z-स्कोर हमें बताता है कि एक मान माध्य से कितने मानक विचलन है। हम z-स्कोर की गणना के लिए निम्नलिखित सूत्र का उपयोग करते हैं:
Z स्कोर = (x i – μ) / σ
सोना:
- x i : एकल डेटा मान
- μ: डेटा सेट का औसत
- σ: डेटासेट का मानक विचलन
Z स्कोर का उपयोग अक्सर डेटा सेट में आउटलेर्स का पता लगाने के लिए किया जाता है। उदाहरण के लिए, -3 से कम या 3 से अधिक z-स्कोर वाले अवलोकनों को अक्सर आउटलेयर माना जाता है।
हालाँकि, z-स्कोर असामान्य रूप से बड़े या छोटे डेटा मानों से प्रभावित हो सकता है। यही कारण है कि आउटलेर्स का पता लगाने का एक अधिक मजबूत तरीका संशोधित z-स्कोर का उपयोग करना है, जिसकी गणना निम्नानुसार की जाती है:
संशोधित z-स्कोर = 0.6745 (x i – x̃) / MAD
सोना:
- x i : एकल डेटा मान
- x̃: डेटासेट का माध्यिका
- एमएडी: डेटासेट का औसत पूर्ण विचलन
एक संशोधित z-स्कोर अधिक मजबूत है क्योंकि यह z-स्कोर की गणना करने के लिए माध्य का उपयोग करता है, माध्य के विपरीत, जिसे आउटलेर्स से प्रभावित माना जाता है।
इग्लेविक्ज़ और होग्लिन अनुशंसा करते हैं कि -3.5 से कम या 3.5 से अधिक संशोधित ज़ेड-स्कोर वाले मानों को संभावित आउटलेर के रूप में लेबल किया जाए।
निम्नलिखित चरण-दर-चरण उदाहरण दिखाता है कि किसी दिए गए डेटा सेट के लिए संशोधित z-स्कोर की गणना कैसे करें।
चरण 1: डेटा बनाएं
मान लीजिए हमारे पास 16 मानों वाला निम्नलिखित डेटासेट है:
चरण 2: माध्यिका ज्ञात करें
आगे, हम माध्यिका ज्ञात करेंगे। यह डेटासेट के मध्यबिंदु को दर्शाता है, जो 16 होता है।
चरण 3: प्रत्येक मान और माध्यिका के बीच पूर्ण अंतर ज्ञात करें
इसके बाद, हम प्रत्येक व्यक्तिगत डेटा मान और माध्यिका के बीच पूर्ण अंतर पाएंगे। उदाहरण के लिए, पहले डेटा मान और माध्यिका के बीच पूर्ण अंतर की गणना निम्नानुसार की जाती है:
पूर्ण अंतर = |6 – 16| =10
हम प्रत्येक व्यक्तिगत डेटा मान और माध्यिका के बीच पूर्ण अंतर की गणना करने के लिए एक ही सूत्र का उपयोग कर सकते हैं:
चरण 4: पूर्ण माध्यिका विचलन ज्ञात करें
इसके बाद, हम पूर्ण माध्य विचलन ज्ञात करेंगे। यह दूसरे कॉलम का माध्यिका है, जो 8 बनता है।
चरण 5: प्रत्येक डेटा मान के लिए संशोधित Z-स्कोर खोजें
अंत में, हम निम्नलिखित सूत्र का उपयोग करके प्रत्येक डेटा मान के लिए संशोधित z-स्कोर की गणना कर सकते हैं:
संशोधित z-स्कोर = 0.6745 (x i – x̃) / MAD
उदाहरण के लिए, पहले डेटा मान के लिए संशोधित z-स्कोर की गणना निम्नानुसार की जाती है:
संशोधित z-स्कोर = 0.6745*(6-16) / 8 = -0.843
हम डेटासेट में प्रत्येक मान के लिए इस सूत्र को दोहरा सकते हैं:
हम देख सकते हैं कि डेटासेट में किसी भी मूल्य का संशोधित z-स्कोर -3.5 से कम या 3.5 से अधिक नहीं है, इसलिए हम इस डेटासेट में किसी भी मूल्य को संभावित आउटलेयर के रूप में लेबल नहीं कर रहे हैं।
आउटलेर्स को कैसे संभालें
यदि आपके डेटा सेट में कोई बाहरी मौजूद है, तो आपके पास कई विकल्प हैं:
- सुनिश्चित करें कि बाहरी डेटा प्रविष्टि त्रुटि का परिणाम नहीं है। कभी-कभी कोई व्यक्ति डेटा सहेजते समय गलत डेटा मान दर्ज कर देता है। यदि कोई बाहरी वस्तु मौजूद है, तो पहले सत्यापित करें कि मान सही ढंग से दर्ज किया गया था और यह कोई त्रुटि नहीं थी।
- आउटलेयर को एक नया मान निर्दिष्ट करें । यदि आउटलेयर डेटा प्रविष्टि त्रुटि का परिणाम बनता है, तो आप इसे एक नया मान निर्दिष्ट करने का निर्णय ले सकते हैं जैसे कि डेटा सेट का माध्य या माध्यिका ।
- बाहरी भाग को हटा दें. यदि मान वास्तव में एक बाहरी है, तो आप इसे हटाने का विकल्प चुन सकते हैं यदि इसका आपके समग्र विश्लेषण पर महत्वपूर्ण प्रभाव पड़ेगा। बस अपनी अंतिम रिपोर्ट या विश्लेषण में यह उल्लेख करना सुनिश्चित करें कि आपने एक बाहरी चीज़ हटा दी है।