एक्सेल में आसानी से आउटलेर्स कैसे खोजें


आउटलायर एक ऐसा अवलोकन है जो डेटा सेट में अन्य मानों से असामान्य रूप से दूर होता है।

आउटलेर्स समस्याग्रस्त हो सकते हैं क्योंकि वे विश्लेषण के परिणामों को प्रभावित कर सकते हैं।

हम आउटलेर्स खोजने के दो तरीकों को प्रदर्शित करने के लिए एक्सेल में निम्नलिखित डेटा सेट का उपयोग करेंगे:

संबंधित: एक्सेल में आउटलेर्स को छोड़कर माध्य की गणना कैसे करें

विधि 1: अंतरचतुर्थक श्रेणी का उपयोग करें

इंटरक्वेर्टाइल रेंज (IQR) एक डेटा सेट में 75वें प्रतिशतक (Q3) और 25वें प्रतिशतक (Q1) के बीच का अंतर है। यह औसत 50% मूल्यों के वितरण को मापता है।

हम एक अवलोकन को बाह्य के रूप में परिभाषित कर सकते हैं यदि यह तीसरे चतुर्थक (Q3) के ऊपर अंतरचतुर्थक सीमा का 1.5 गुना है या पहले चतुर्थक (Q1) के नीचे अंतरचतुर्थक सीमा का 1.5 गुना है।

निम्नलिखित छवि दिखाती है कि एक्सेल में इंटरक्वेर्टाइल रेंज की गणना कैसे करें:

फिर हम डेटासेट में किसी भी आउटलेर्स को “1” निर्दिष्ट करने के लिए ऊपर उल्लिखित सूत्र का उपयोग कर सकते हैं:

एक्सेल में आउटलेर्स खोजें

हम देखते हैं कि इस डेटासेट में केवल एक मान – 164 – एक आउटलायर साबित होता है।

विधि 2: z-स्कोर का उपयोग करें

एक z-स्कोर आपको बताता है कि दिया गया मान माध्य से कितने मानक विचलन है। हम z-स्कोर की गणना के लिए निम्नलिखित सूत्र का उपयोग करते हैं:

z = (एक्स – μ) / σ

सोना:

  • X एकल कच्चा डेटा मान है
  • μ जनसंख्या माध्य है
  • σ जनसंख्या मानक विचलन है

हम किसी अवलोकन को बाह्य के रूप में परिभाषित कर सकते हैं यदि उसका z-स्कोर -3 से कम या 3 से अधिक है।

निम्नलिखित छवि दिखाती है कि एक्सेल में डेटा सेट के माध्य और मानक विचलन की गणना कैसे करें:

फिर हम डेटासेट में प्रत्येक व्यक्तिगत मान के लिए z-स्कोर खोजने के लिए माध्य और मानक विचलन का उपयोग कर सकते हैं:

फिर हम किसी भी मान को “1” निर्दिष्ट कर सकते हैं जिसका z-स्कोर -3 से कम या 3 से अधिक है:

Z-स्कोर का उपयोग करके एक्सेल में आउटलेर्स ढूँढना

इस पद्धति का उपयोग करके, हम देखते हैं कि डेटासेट में कोई आउटलेयर नहीं हैं।

ध्यान दें: कभी-कभी 3 के बजाय 2.5 का z-स्कोर उपयोग किया जाता है। इस मामले में, 164 का व्यक्तिगत मान एक बाहरी माना जाएगा क्योंकि इसका z-स्कोर 2.5 से अधिक है।

ज़ेड-स्कोर विधि का उपयोग करते समय, यह निर्धारित करने के लिए अपने निर्णय का उपयोग करें कि आप किस ज़ेड-स्कोर मान को बाहरी मानते हैं।

आउटलेर्स को कैसे संभालें

यदि आपके डेटा में कोई बाहरी चीज़ मौजूद है, तो आपके पास कई विकल्प हैं:

1. सुनिश्चित करें कि बाहरी डेटा प्रविष्टि त्रुटि का परिणाम नहीं है।

कभी-कभी कोई व्यक्ति डेटा सहेजते समय गलत डेटा मान दर्ज कर देता है। यदि कोई बाहरी वस्तु मौजूद है, तो पहले सत्यापित करें कि मान सही ढंग से दर्ज किया गया था और यह कोई त्रुटि नहीं थी।

2. बाहरी हिस्से को हटा दें.

यदि मान वास्तव में एक बाहरी है, तो आप इसे हटाने का विकल्प चुन सकते हैं यदि इसका आपके समग्र विश्लेषण पर महत्वपूर्ण प्रभाव पड़ेगा। बस अपनी अंतिम रिपोर्ट या विश्लेषण में यह उल्लेख करना सुनिश्चित करें कि आपने एक बाहरी चीज़ हटा दी है।

3. आउटलेयर को एक नया मान निर्दिष्ट करें

यदि आउटलेयर डेटा प्रविष्टि त्रुटि का परिणाम है, तो आप इसे एक नया मान निर्दिष्ट करने का निर्णय ले सकते हैं जैसे कि डेटा सेट का माध्य या माध्यिका

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *