सांख्यिकी में औसत का उपयोग करने के फायदे और नुकसान
डेटा सेट का माध्य डेटा सेट के औसत मूल्य को दर्शाता है।
इसकी गणना इस प्रकार की जाती है:
औसत = Σx i / n
सोना:
- Σ: एक प्रतीक जिसका अर्थ है “योग”
- x i : डेटा सेट में i वां अवलोकन
- n: डेटासेट में अवलोकनों की कुल संख्या
डेटा सेट के “केंद्र” या “औसत” का वर्णन करने के लिए माध्य का उपयोग करने के दो मुख्य फायदे हैं:
लाभ #1: औसत अपनी गणना में डेटा सेट से सभी अवलोकनों का उपयोग करता है। आँकड़ों में, यह आम तौर पर एक अच्छी बात है क्योंकि ऐसा कहा जाता है कि इसमें डेटा सेट में उपलब्ध सभी जानकारी का उपयोग किया जाता है।
लाभ #2: औसत की गणना और व्याख्या करना आसान है। माध्य सभी प्रेक्षणों के योग को प्रेक्षणों की कुल संख्या से विभाजित करने पर प्राप्त होता है। इसकी गणना करना आसान है (यहां तक कि मैन्युअल रूप से भी) और व्याख्या करना आसान है।
हालाँकि, किसी डेटा सेट को सारांशित करने के लिए माध्य का उपयोग करने में दो संभावित कमियाँ हैं:
नुकसान #1: औसत आउटलेर्स से प्रभावित होता है। यदि किसी डेटा सेट में अत्यधिक बाह्यता है, तो यह माध्य को प्रभावित करता है और इसे डेटा सेट के केंद्र का एक अविश्वसनीय माप बनाता है।
नुकसान #2: विषम डेटा सेट के साथ औसत भ्रामक हो सकता है। जब कोई डेटा सेट बाईं या दाईं ओर झुका होता है, तो औसत डेटा सेट के केंद्र को मापने का एक भ्रामक तरीका हो सकता है।
निम्नलिखित उदाहरण व्यवहार में इन फायदों और नुकसानों को दर्शाते हैं।
उदाहरण 1: औसत का उपयोग करने के लाभ
मान लीजिए कि हमारे पास निम्नलिखित हिस्टोग्राम है जो किसी विशेष शहर के निवासियों के वेतन को दर्शाता है:
चूँकि यह वितरण आम तौर पर सममित होता है (यदि आप इसे बीच से विभाजित करते हैं, तो प्रत्येक आधा लगभग बराबर दिखेगा) और इसमें कोई आउटलेयर नहीं है, डेटा के इस सेट के केंद्र का वर्णन करने के लिए माध्य एक उपयोगी तरीका है।
औसत $63,000 निकलता है, जो लगभग वितरण के केंद्र में है:
इस विशेष उदाहरण में, हम औसत के दोनों लाभों का उपयोग करने में सक्षम थे:
लाभ #1: औसत अपनी गणना में डेटा सेट से सभी अवलोकनों का उपयोग करता है।
क्योंकि वितरण अनिवार्य रूप से सममित था और कोई चरम आउटलेर नहीं था, हम औसत की गणना करने के लिए सभी उपलब्ध वेतन का उपयोग करने में सक्षम थे, जिससे हमें इस विशेष शहर में “औसत” या “सामान्य” वेतन का एक अच्छा विचार मिला।
लाभ #2: औसत की गणना और व्याख्या करना आसान है। यह समझना आसान है कि $63,000 का औसत वेतन इस शहर में एक व्यक्ति के “औसत” वेतन का प्रतिनिधित्व करता है।
हालाँकि कुछ व्यक्ति इससे बहुत अधिक कमाते हैं और अन्य बहुत कम, यह औसत मूल्य हमें इस शहर में “सामान्य” वेतन का एक अच्छा विचार देता है।
उदाहरण 2: औसत का उपयोग करने के नुकसान
मान लीजिए कि हमारे पास बहुत विषम वेतन वितरण है और हम औसत और औसत वेतन दोनों की गणना करने का निर्णय लेते हैं:
वितरण की पूंछ पर उच्च मान माध्य को केंद्र से दूर और लंबी पूंछ की ओर ले जाते हैं।
इस उदाहरण में, औसत हमें बताता है कि एक सामान्य व्यक्ति प्रति वर्ष लगभग $47,000 कमाता है, जबकि औसत हमें बताता है कि सामान्य व्यक्ति प्रति वर्ष केवल लगभग $32,000 कमाता है, जो कि सामान्य व्यक्ति का कहीं अधिक प्रतिनिधि है।
इस उदाहरण में, माध्य इस वितरण में “सामान्य” या “औसत” मान को खराब ढंग से सारांशित करता है क्योंकि वितरण विषम है।
या मान लें कि हमारे पास एक अन्य वितरण है जिसमें एक निश्चित सड़क पर घरों के वर्ग फुटेज के बारे में जानकारी है और हम डेटासेट के माध्य और मध्यिका दोनों की गणना करने का निर्णय लेते हैं:
औसत कुछ अत्यधिक बड़े घरों से प्रभावित होता है, जिसके कारण इसका मूल्य बहुत अधिक हो जाता है।
यह औसत वर्ग फ़ुटेज मान को भ्रामक बनाता है और उस सड़क पर एक घर के “सामान्य” वर्ग फ़ुटेज का एक ख़राब माप देता है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल सांख्यिकी में माध्य और मध्यिका के बारे में अतिरिक्त जानकारी प्रदान करते हैं:
आउटलाइर्स माध्य को कैसे प्रभावित करते हैं?
किसी हिस्टोग्राम के माध्य और माध्यिका का अनुमान कैसे लगाएं
तने और पत्ती के भूखंडों का माध्य और माध्यिका कैसे ज्ञात करें