संशोधित z स्कोर क्या है? (परिभाषा & #038; उदाहरण)


आंकड़ों में, एक z-स्कोर हमें बताता है कि एक मान माध्य से कितने मानक विचलन है। हम z-स्कोर की गणना के लिए निम्नलिखित सूत्र का उपयोग करते हैं:

Z स्कोर = (x i – μ) / σ

सोना:

  • x i : एकल डेटा मान
  • μ: डेटा सेट का औसत
  • σ: डेटासेट का मानक विचलन

Z स्कोर का उपयोग अक्सर डेटा सेट में आउटलेर्स का पता लगाने के लिए किया जाता है। उदाहरण के लिए, -3 से कम या 3 से अधिक z-स्कोर वाले अवलोकनों को अक्सर आउटलेयर माना जाता है।

हालाँकि, z-स्कोर असामान्य रूप से बड़े या छोटे डेटा मानों से प्रभावित हो सकता है। यही कारण है कि आउटलेर्स का पता लगाने का एक अधिक मजबूत तरीका संशोधित z-स्कोर का उपयोग करना है, जिसकी गणना निम्नानुसार की जाती है:

संशोधित z-स्कोर = 0.6745 (x i – x̃) / MAD

सोना:

  • x i : एकल डेटा मान
  • x̃: डेटासेट का माध्यिका
  • एमएडी: डेटासेट का औसत पूर्ण विचलन

एक संशोधित z-स्कोर अधिक मजबूत है क्योंकि यह z-स्कोर की गणना करने के लिए माध्य का उपयोग करता है, माध्य के विपरीत, जिसे आउटलेर्स से प्रभावित माना जाता है।

इग्लेविक्ज़ और होग्लिन अनुशंसा करते हैं कि -3.5 से कम या 3.5 से अधिक संशोधित ज़ेड-स्कोर वाले मानों को संभावित आउटलेर के रूप में लेबल किया जाए।

निम्नलिखित चरण-दर-चरण उदाहरण दिखाता है कि किसी दिए गए डेटा सेट के लिए संशोधित z-स्कोर की गणना कैसे करें।

चरण 1: डेटा बनाएं

मान लीजिए हमारे पास 16 मानों वाला निम्नलिखित डेटासेट है:

चरण 2: माध्यिका ज्ञात करें

आगे, हम माध्यिका ज्ञात करेंगे। यह डेटासेट के मध्यबिंदु को दर्शाता है, जो 16 होता है।

चरण 3: प्रत्येक मान और माध्यिका के बीच पूर्ण अंतर ज्ञात करें

इसके बाद, हम प्रत्येक व्यक्तिगत डेटा मान और माध्यिका के बीच पूर्ण अंतर पाएंगे। उदाहरण के लिए, पहले डेटा मान और माध्यिका के बीच पूर्ण अंतर की गणना निम्नानुसार की जाती है:

पूर्ण अंतर = |6 – 16| =10

हम प्रत्येक व्यक्तिगत डेटा मान और माध्यिका के बीच पूर्ण अंतर की गणना करने के लिए एक ही सूत्र का उपयोग कर सकते हैं:

चरण 4: पूर्ण माध्यिका विचलन ज्ञात करें

इसके बाद, हम पूर्ण माध्य विचलन ज्ञात करेंगे। यह दूसरे कॉलम का माध्यिका है, जो 8 बनता है।

चरण 5: प्रत्येक डेटा मान के लिए संशोधित Z-स्कोर खोजें

अंत में, हम निम्नलिखित सूत्र का उपयोग करके प्रत्येक डेटा मान के लिए संशोधित z-स्कोर की गणना कर सकते हैं:

संशोधित z-स्कोर = 0.6745 (x i – x̃) / MAD

उदाहरण के लिए, पहले डेटा मान के लिए संशोधित z-स्कोर की गणना निम्नानुसार की जाती है:

संशोधित z-स्कोर = 0.6745*(6-16) / 8 = -0.843

हम डेटासेट में प्रत्येक मान के लिए इस सूत्र को दोहरा सकते हैं:

हम देख सकते हैं कि डेटासेट में किसी भी मूल्य का संशोधित z-स्कोर -3.5 से कम या 3.5 से अधिक नहीं है, इसलिए हम इस डेटासेट में किसी भी मूल्य को संभावित आउटलेयर के रूप में लेबल नहीं कर रहे हैं।

आउटलेर्स को कैसे संभालें

यदि आपके डेटा सेट में कोई बाहरी मौजूद है, तो आपके पास कई विकल्प हैं:

  • सुनिश्चित करें कि बाहरी डेटा प्रविष्टि त्रुटि का परिणाम नहीं है। कभी-कभी कोई व्यक्ति डेटा सहेजते समय गलत डेटा मान दर्ज कर देता है। यदि कोई बाहरी वस्तु मौजूद है, तो पहले सत्यापित करें कि मान सही ढंग से दर्ज किया गया था और यह कोई त्रुटि नहीं थी।
  • आउटलेयर को एक नया मान निर्दिष्ट करें । यदि आउटलेयर डेटा प्रविष्टि त्रुटि का परिणाम बनता है, तो आप इसे एक नया मान निर्दिष्ट करने का निर्णय ले सकते हैं जैसे कि डेटा सेट का माध्य या माध्यिका
  • बाहरी भाग को हटा दें. यदि मान वास्तव में एक बाहरी है, तो आप इसे हटाने का विकल्प चुन सकते हैं यदि इसका आपके समग्र विश्लेषण पर महत्वपूर्ण प्रभाव पड़ेगा। बस अपनी अंतिम रिपोर्ट या विश्लेषण में यह उल्लेख करना सुनिश्चित करें कि आपने एक बाहरी चीज़ हटा दी है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *