बॉक्स प्लॉट्स में विषमता की पहचान कैसे करें


बॉक्स प्लॉट एक प्रकार का प्लॉट है जो डेटा सेट का पांच अंकों का सारांश प्रदर्शित करता है, जिसमें शामिल हैं:

  • न्यूनतम मूल्य
  • प्रथम चतुर्थक (25वाँ प्रतिशतक)
  • माध्यिका मान
  • तीसरा चतुर्थक (75वाँ प्रतिशतक)
  • अधिकतम मूल्य

हम बॉक्स प्लॉट बनाने के लिए निम्नलिखित प्रक्रिया का उपयोग करते हैं:

  • पहले चतुर्थक (Q1) से तीसरे चतुर्थक (Q3) तक एक बॉक्स बनाएं
  • फिर बॉक्स के अंदर मध्यिका पर एक रेखा खींचें
  • फिर न्यूनतम और अधिकतम मानों तक चतुर्थक की “मूंछें” बनाएं।

बॉक्सप्लॉट में माध्यिका मान कहां है, इसके आधार पर हम यह निर्धारित कर सकते हैं कि वितरण विषम है या नहीं।

बॉक्स प्लॉट की विषमता

जब माध्यिका बॉक्स के निचले भाग के करीब होती है और बॉक्स के निचले सिरे पर मूंछ छोटी होती है, तो वितरण दाएं-तिरछा (या “सकारात्मक रूप से” तिरछा) होता है।

जब माध्यिका बॉक्स के शीर्ष के करीब होती है और बॉक्स के ऊपरी सिरे पर मूंछ छोटी होती है, तो वितरण तिरछा (या “नकारात्मक” तिरछा) रह जाता है।

जब माध्यिका बॉक्स के मध्य में होती है और मूंछें दोनों तरफ लगभग बराबर होती हैं, तो वितरण सममित (या “नहीं” असममित) होता है।

निम्नलिखित उदाहरण बताते हैं कि यह निर्धारित करने के लिए बॉक्सप्लॉट का उपयोग कैसे करें कि कोई वितरण दाएं-तिरछा है, बाएं-तिरछा है, या कोई तिरछा नहीं है।

उदाहरण 1: दाएँ-तिरछा वितरण

संयुक्त राज्य अमेरिका में वार्षिक घरेलू आय का वितरण सही-तिरछा है। अधिकांश परिवार प्रति वर्ष $40,000 और $80,000 के बीच कमाते हैं, लेकिन वितरण पर एक लंबी दाहिनी पूंछ होती है जो उन परिवारों का प्रतिनिधित्व करती है जो बहुत अधिक कमाते हैं।

यदि हमने घरेलू आय के वितरण की कल्पना करने के लिए एक बॉक्स प्लॉट बनाया, तो यह इस तरह दिखेगा:

ध्यान दें कि बॉक्स के अंदर की ऊर्ध्वाधर रेखा जो माध्यिका का प्रतिनिधित्व करती है वह तीसरे चतुर्थक की तुलना में पहले चतुर्थक के बहुत करीब है, जिसका अर्थ है कि वितरण दाईं ओर तिरछा है।

उदाहरण 2: बाएँ-तिरछा वितरण

अधिकांश आबादी में मृत्यु का आयु वितरण बाईं ओर झुका हुआ है। अधिकांश लोग 70 से 80 वर्ष की आयु के बीच रहते हैं, और इस आयु से कम ही लोग जीवित रहते हैं।

यदि हमने मौतों के आयु वितरण की कल्पना करने के लिए एक बॉक्स प्लॉट बनाया, तो यह इस तरह दिखेगा:

ध्यान दें कि बॉक्स के अंदर की ऊर्ध्वाधर रेखा जो माध्यिका का प्रतिनिधित्व करती है वह पहले चतुर्थक की तुलना में तीसरे चतुर्थक के बहुत करीब है, जिसका अर्थ है कि वितरण बाईं ओर तिरछा है।

उदाहरण 3: सममित वितरण

नर का आकार वितरण लगभग सममित है और कोई विषमता नहीं दिखाता है। उदाहरण के लिए, संयुक्त राज्य अमेरिका में एक आदमी की औसत ऊंचाई लगभग 69.1 इंच है। ऊंचाई का वितरण लगभग सममित है, कुछ छोटे और कुछ लम्बे हैं।

यदि हमने संयुक्त राज्य अमेरिका में पुरुष ऊंचाई के वितरण की कल्पना करने के लिए एक बॉक्स प्लॉट बनाया, तो यह इस तरह दिखेगा:

ध्यान दें कि बॉक्स के अंदर की ऊर्ध्वाधर रेखा जो माध्यिका का प्रतिनिधित्व करती है वह भी पहले चतुर्थक और तीसरे चतुर्थक के करीब है, जिसका अर्थ है कि वितरण सममित और तिरछापन के बिना है।

अतिरिक्त संसाधन

बाएँ या दाएँ तिरछा वितरण
बॉक्स प्लॉट्स की तुलना कैसे करें: उदाहरणों के साथ
एक्सेल में साइड-बाय-साइड बॉक्स प्लॉट कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *