सांख्यिकी में माध्यिका का उपयोग करने के फायदे और नुकसान
माध्यिका डेटा सेट के मध्य मान का प्रतिनिधित्व करती है।
इसकी गणना डेटा सेट में सभी अवलोकनों को सबसे छोटे से सबसे बड़े तक क्रमबद्ध करके और फिर औसत मूल्य की पहचान करके की जाती है।
डेटा सेट के केंद्र का वर्णन करने के लिए माध्यिका का उपयोग करने के दो मुख्य लाभ हैं:
लाभ #1: माध्यिका आउटलेर्स से प्रभावित नहीं होती है। चूँकि माध्यिका केवल डेटा सेट का मध्य मान पाता है, यह डेटा सेट के दोनों छोर पर अत्यधिक छोटे या अत्यधिक बड़े मूल्यों से प्रभावित नहीं होता है।
लाभ #2: माध्यिका विषम डेटा सेट के लिए केंद्र का एक अच्छा माप है। जब किसी डेटा सेट को बायीं या दायीं ओर तिरछा किया जाता है, तो माध्य अभी भी डेटा सेट के केंद्रीय मूल्य की पहचान करने में सक्षम होता है, माध्य के विपरीत, जो तिरछे वितरण से काफी प्रभावित होता है।
हालाँकि, डेटा सेट को सारांशित करने के लिए माध्यिका का उपयोग करने में दो संभावित कमियाँ हैं:
नुकसान #1: माध्यिका अपनी गणना में डेटा सेट के सभी अवलोकनों का उपयोग नहीं करती है। आंकड़ों में, हम आम तौर पर कहते हैं कि यह अच्छी बात है अगर हम डेटा सेट में सभी अवलोकनों का उपयोग कर सकते हैं, क्योंकि तब हम अपने डेटा से उपलब्ध सभी जानकारी का उपयोग कर रहे हैं। हालाँकि, माध्यिका किसी डेटा सेट में अत्यंत छोटे या अत्यंत बड़े मानों की जानकारी को ध्यान में नहीं रखती है।
नुकसान #2: माध्यिका का उपयोग डेटासेट में सभी अवलोकनों का योग ज्ञात करने के लिए नहीं किया जा सकता है। यदि हम किसी डेटासेट का माध्य और कुल नमूना आकार जानते हैं, तो हम डेटासेट में सभी मानों का योग पा सकते हैं। हालाँकि, हम माध्यिका के साथ वही काम नहीं कर सकते।
निम्नलिखित उदाहरण व्यवहार में इन फायदों और नुकसानों को दर्शाते हैं।
उदाहरण 1: माध्यिका का उपयोग करने के लाभ
मान लीजिए कि हमारे पास बहुत विषम वेतन वितरण है और हम औसत और औसत वेतन दोनों की गणना करने का निर्णय लेते हैं:
औसत हमें बताता है कि एक सामान्य व्यक्ति प्रति वर्ष लगभग $47,000 कमाता है, जबकि औसत हमें बताता है कि सामान्य व्यक्ति प्रति वर्ष केवल लगभग $32,000 कमाता है, जो कि सामान्य व्यक्ति का कहीं अधिक प्रतिनिधि है।
इस उदाहरण में, माध्य वितरण की दाईं ओर के उच्चतम मानों से प्रभावित होता है, जबकि माध्य नहीं होता है।
या मान लें कि हमारे पास एक अन्य वितरण है जिसमें एक निश्चित सड़क पर घरों के वर्ग फुटेज के बारे में जानकारी है और हम डेटासेट के माध्य और मध्यिका दोनों की गणना करने का निर्णय लेते हैं:
औसत कुछ अत्यधिक बड़े घरों से प्रभावित होता है, जिसके कारण इसका मूल्य बहुत अधिक हो जाता है।
हालाँकि, माध्य इन आउटलेर्स से प्रभावित नहीं होता है और इसलिए उस सड़क पर एक घर के “सामान्य” वर्ग फुटेज का बेहतर माप प्रदान करता है।
उदाहरण 2: माध्यिका का उपयोग करने के नुकसान
आइए माध्यिका के पहले संभावित नुकसान को याद करें:
नुकसान #1: माध्यिका अपनी गणना में डेटा सेट के सभी अवलोकनों का उपयोग नहीं करती है।
उदाहरण के लिए, मान लें कि हमारे पास निम्नलिखित डेटासेट हैं जो एक कक्षा में छात्रों के लिए परीक्षा अंकों के वितरण को दर्शाते हैं:
रेटिंग: 68, 70, 71, 75, 78, 82, 83 , 83, 85, 90, 91, 91, 92
परीक्षा में औसत अंक 83 है।
अब मान लीजिए कि हमारे पास समान डेटा सेट है, लेकिन तीन सबसे कम परीक्षा स्कोर बहुत कम हैं:
रेटिंग: 22, 35, 38, 75, 78, 82, 83 , 83, 85, 90, 91, 91, 92
इस वितरण में औसत परीक्षा स्कोर अभी भी 83 है।
यही कारण है कि हम कहते हैं कि माध्य डेटा सेट में उपलब्ध सभी सूचनाओं का उपयोग नहीं करता है: यह डेटा के वास्तविक मूल्यों को ध्यान में नहीं रखता है क्योंकि यह केवल स्थिति का माप है।
आइए अब माध्यिका के दूसरे संभावित नुकसान को याद करें:
नुकसान #2: माध्यिका का उपयोग डेटासेट में सभी अवलोकनों का योग ज्ञात करने के लिए नहीं किया जा सकता है।
मान लीजिए कि हमारे पास निम्नलिखित डेटा सेट है जिसमें एक विशेष तिमाही में 11 विभिन्न कर्मचारियों द्वारा की गई कुल बिक्री की जानकारी है:
बिक्री: 12, 12, 15, 19, 22, 24 , 28, 30, 32, 35, 38
हम जानते हैं कि औसत मान 24 है और हम जानते हैं कि कुल 11 कर्मचारी हैं। हालाँकि, हम इस जानकारी का उपयोग सभी कर्मचारियों की कुल बिक्री राशि जानने के लिए नहीं कर सकते।
दूसरी ओर, यदि हमें पता होता कि औसत मूल्य 24 है और कुल 11 कर्मचारी हैं, तो हम 24 को 11 से गुणा करके यह पता लगा सकते हैं कि कुल बिक्री योग 24 * 11 = 264 है।
नोट : आपके डेटा के वितरण और जिस समस्या को आप हल करने का प्रयास कर रहे हैं, उसके आधार पर माध्य या माध्यिका उपयोग के लिए पसंदीदा मीट्रिक हो सकता है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल सांख्यिकी में माध्य और मध्यिका के बारे में अतिरिक्त जानकारी प्रदान करते हैं:
आउटलाइर्स माध्य को कैसे प्रभावित करते हैं?
किसी हिस्टोग्राम के माध्य और माध्यिका का अनुमान कैसे लगाएं
तने और पत्ती के भूखंडों का माध्य और माध्यिका कैसे ज्ञात करें