वास्तविक जीवन में आउटलेर्स के 5 उदाहरण


आउटलायर एक डेटा बिंदु है जो डेटा सेट में अन्य मानों से असामान्य रूप से दूर है।

हम अक्सर एक डेटा बिंदु को बाहरी के रूप में परिभाषित करते हैं यदि यह तीसरे चतुर्थक के ऊपर इंटरचतुर्थक सीमा का 1.5 गुना है या डेटा सेट के पहले चतुर्थक के नीचे इंटरचतुर्थक सीमा का 1.5 गुना है।

ध्यान दें : अंतरचतुर्थक सीमा किसी डेटा सेट के तीसरे चतुर्थक (75वें प्रतिशतक) और पहले चतुर्थक (25वें प्रतिशतक) के बीच का अंतर है।

निम्नलिखित परिदृश्य वास्तविक दुनिया की स्थितियों में आउटलेर्स के उदाहरण दिखाते हैं।

उदाहरण 1: आय आउटलेयर

एक ठोस परिदृश्य जिसमें आउटलेर्स अक्सर दिखाई देते हैं वह आय वितरण का है।

उदाहरण के लिए, किसी निश्चित देश में वार्षिक आय का 25वां प्रतिशतक (Q1) $15,000 प्रति वर्ष और 75वां प्रतिशतक (Q3) $120,000 प्रति वर्ष हो सकता है।

इंटरक्वेर्टाइल रेंज (आईक्यूआर) की गणना इस प्रकार की जाएगी: $120,000 – $15,000 = $105,000।

इसका मतलब यह है कि जिस किसी की आय निम्नलिखित सीमा से बाहर होगी, उसे बाहरी माना जाएगा:

  • निचली सीमा : Q1 – 1.5*IQR = $15,000 – 1.5*$105,000 = -$142,500
  • ऊपरी सीमा : Q3 + 1.5*IQR = $120,000 + 1.5*$105,000 = $277,500

एलोन मस्क जैसे व्यक्ति, जिनकी कुल संपत्ति खरबों डॉलर में है, को वार्षिक आय के मामले में सबसे आगे माना जाएगा।

ध्यान दें : निचली सीमा से परे आउटलेर्स का मूल्य हमेशा सार्थक नहीं होता है, उदाहरण के लिए, नकारात्मक वार्षिक आय अर्जित करना संभव नहीं है।

उदाहरण 2: एपनिया आउटलेर्स

एक और वास्तविक दुनिया का परिदृश्य जिसमें आउटलेर्स अक्सर दिखाई देते हैं वह है एपनिया।

उदाहरण के लिए, कोई व्यक्ति कितनी देर तक अपनी सांस रोक सकता है, इसका 25वां प्रतिशतक (Q1) लगभग 15 सेकंड है, जबकि 75वां प्रतिशतक (Q3) लगभग 75 सेकंड है।

अंतरचतुर्थक सीमा (IQR) की गणना इस प्रकार की जाएगी: 75 – 15 = 60।

इसका मतलब यह है कि निम्नलिखित सीमाओं के बाहर अपनी सांस रोकने में सक्षम किसी भी व्यक्ति को बाहरी व्यक्ति माना जाएगा:

  • निचली सीमा : Q1 – 1.5*IQR = 15 – 1.5*60 = -75 सेकंड
  • ऊपरी सीमा : Q3 + 1.5*IQR = 75 + 1.5*60 = 165 सेकंड

सभी स्वतंत्र गोताखोर जो 10 मिनट या उससे अधिक समय तक अपनी सांस रोक सकते हैं, उन्हें बाहरी माना जाएगा क्योंकि वे 165 सेकंड से अधिक समय तक अपनी सांस रोक सकते हैं।

उदाहरण 3: जानवरों के आकार में आउटलेयर

एक और वास्तविक दुनिया का परिदृश्य जिसमें आउटलेर्स अक्सर दिखाई देते हैं वह है जानवर का आकार।

उदाहरण के लिए, घोड़े की ऊंचाई का 25वां प्रतिशतक (Q1) लगभग 5 फीट है और 75वां प्रतिशतक (Q3) लगभग 5.5 फीट है।

इंटरक्वेर्टाइल रेंज (आईक्यूआर) की गणना इस प्रकार की जाएगी: 5.5 – 5 = 0.5 फीट।

इसका मतलब यह है कि कोई भी घोड़ा जिसका आकार निम्नलिखित सीमाओं से बाहर है, उसे बाहरी माना जाएगा:

  • निचली सीमा : Q1 – 1.5*IQR = 5 – 1.5*0.5 = 4.25 फीट
  • ऊपरी सीमा : Q3 + 1.5*IQR = 5 + 1.5*0.5 = 5.75 फीट

गिनीज वर्ल्ड रिकॉर्ड्स के अनुसार, अब तक के सबसे ऊंचे घोड़े का रिकॉर्ड सिर्फ 7 फीट से अधिक का है। चूँकि यह 5.75 फीट की ऊपरी सीमा से ऊपर है, इसलिए इस घोड़े को स्पष्ट रूप से बाहरी माना जाएगा।

उदाहरण 4: मूवी टिकट बिक्री में आउटलेयर

एक और वास्तविक दुनिया का परिदृश्य जिसमें आउटलेर्स अक्सर दिखाई देते हैं वह फिल्म टिकटों की बिक्री में है।

उदाहरण के लिए, सकल मूवी टिकट बिक्री का 25वां प्रतिशतक (Q1) लगभग $2 मिलियन है और 75वां प्रतिशतक (Q3) लगभग $15 मिलियन है।

इंटरक्वेर्टाइल रेंज (आईक्यूआर) की गणना इस प्रकार की जाएगी: $15 मिलियन – $2 मिलियन = $13 मिलियन।

इसका मतलब यह है कि कोई भी फिल्म जिसकी सकल बिक्री निम्नलिखित सीमा से बाहर हो, उसे आउटलायर माना जाएगा:

  • निचली सीमा : T1 – 1.5*IQR = $2 मिलियन – 1.5*$13 मिलियन = -$17.5 मिलियन
  • ऊपरी सीमा : T3 + 1.5*IQR = $15 मिलियन + 1.5*$13 मिलियन = $34.5 मिलियन

अधिकांश स्टार वार्स फिल्मों ने $34.5 मिलियन से अधिक की कमाई की है, जिससे टिकट बिक्री के मामले में वे पिछड़ गईं।

उदाहरण 5: प्रति गेम अर्जित अंकों में आउटलेयर

एक और वास्तविक दुनिया का क्षेत्र जिसमें आउटलेर्स अक्सर दिखाई देते हैं वह पेशेवर खेल है।

उदाहरण के लिए, NBA खिलाड़ियों द्वारा अर्जित अंकों का 25वां प्रतिशतक (Q1) प्रति गेम लगभग 5 अंक है और 75वां प्रतिशतक (Q3) प्रति गेम लगभग 15 अंक है।

अंतरचतुर्थक सीमा (IQR) की गणना इस प्रकार की जाएगी: 15 – 5 = 10 अंक।

इसका मतलब यह है कि कोई भी खिलाड़ी जिसका औसत निम्नलिखित सीमा से बाहर आता है उसे आउटलायर माना जाएगा:

  • निचली सीमा : Q1 – 1.5*IQR = 5 – 1.5*10 = -10 अंक
  • ऊपरी सीमा : Q3 + 1.5*IQR = 15 + 1.5*10 = 30 अंक

कई एनबीए सीज़न में, उच्चतम स्कोरिंग खिलाड़ी आमतौर पर प्रति गेम 30 से अधिक अंक स्कोर करता है, जिससे वह पिछड़ जाता है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि विभिन्न सांख्यिकीय सॉफ़्टवेयर का उपयोग करके डेटा सेट में आउटलेर्स कैसे खोजें:

एक्सेल में आउटलेर्स कैसे खोजें
आर में आउटलेर्स कैसे खोजें
पायथन में आउटलेर्स कैसे खोजें
एसपीएसएस में आउटलेर्स कैसे खोजें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *