Google शीट्स में आसानी से आउटलेर्स कैसे खोजें
आउटलायर एक ऐसा अवलोकन है जो डेटा सेट में अन्य मानों से असामान्य रूप से दूर होता है।
हम अक्सर एक अवलोकन को बाह्य के रूप में परिभाषित करते हैं यदि यह तीसरे चतुर्थक के ऊपर अंतरचतुर्थक सीमा का 1.5 गुना है या पहले चतुर्थक के नीचे अंतरचतुर्थक सीमा का 1.5 गुना है।
नोट: अंतरचतुर्थक सीमा किसी डेटा सेट के तीसरे चतुर्थक (75वें प्रतिशतक) और पहले चतुर्थक (25वें प्रतिशतक) के बीच का अंतर है। यह औसत 50% मूल्यों के वितरण को मापता है।
निम्नलिखित चरण-दर-चरण उदाहरण दिखाता है कि Google शीट्स में डेटा सेट में आउटलेर्स को खोजने के लिए इस सूत्र का उपयोग कैसे करें।
चरण 1: डेटा दर्ज करें
सबसे पहले, आइए निम्नलिखित डेटासेट से Google शीट में मान दर्ज करें:
चरण 2: अंतरचतुर्थक सीमा की गणना करें
इसके बाद, आइए डेटासेट की पहली चतुर्थक, तीसरी चतुर्थक और अंतःचतुर्थक श्रेणी की गणना करें:
चरण 3: आउटलेर्स की पहचान करें
फिर हम डेटासेट में किसी भी आउटलेर्स को “1” निर्दिष्ट करने के लिए निम्नलिखित सूत्र का उपयोग कर सकते हैं:
= IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )
यह सूत्र जाँचता है कि क्या कोई अवलोकन तीसरे चतुर्थक के ऊपर अंतरचतुर्थक सीमा का 1.5 गुना है या पहले चतुर्थक के नीचे अंतरचतुर्थक सीमा का 1.5 गुना है।
यदि इनमें से कोई भी सत्य है, तो अवलोकन को बाहरी के रूप में नामित करने के लिए “1” निर्दिष्ट किया जाता है।
निम्नलिखित स्क्रीनशॉट दिखाता है कि व्यवहार में इस सूत्र का उपयोग कैसे करें:
हम देखते हैं कि हमारे डेटासेट में केवल एक मान बाहरी होता है: 164 ।
आउटलेर्स को कैसे संभालें
यदि आपके डेटा में कोई बाहरी चीज़ मौजूद है, तो आपके पास कई विकल्प हैं:
1. सुनिश्चित करें कि बाहरी डेटा प्रविष्टि त्रुटि का परिणाम नहीं है।
कभी-कभी साधारण डेटा गलत तरीके से सहेजा जाता है। यदि कोई बाहरी वस्तु मौजूद है, तो पहले सत्यापित करें कि मान सही ढंग से दर्ज किया गया था और यह कोई त्रुटि नहीं थी।
2. आउटलेयर को एक नया मान निर्दिष्ट करें ।
यदि आउटलेयर डेटा प्रविष्टि त्रुटि का परिणाम है, तो आप इसे एक नया मान निर्दिष्ट करने का निर्णय ले सकते हैं जैसे कि डेटा सेट का माध्य या माध्यिका।
3. बाहरी हिस्से को हटा दें.
यदि मान वास्तव में एक बाहरी है, तो आप इसे हटाने का विकल्प चुन सकते हैं यदि इसका आपके समग्र विश्लेषण पर महत्वपूर्ण प्रभाव पड़ेगा। बस अपनी अंतिम रिपोर्ट में यह उल्लेख करना सुनिश्चित करें कि आपने एक बाहरी चीज़ हटा दी है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि अन्य सांख्यिकीय सॉफ़्टवेयर में आउटलेर्स को कैसे हटाया जाए:
आर में आउटलेर्स को कैसे हटाएं
पायथन में आउटलेर्स कैसे हटाएं
एसपीएसएस में आउटलेर्स को कैसे हटाएं