बॉक्स प्लॉट्स की तुलना कैसे करें: उदाहरणों के साथ
बॉक्स प्लॉट एक प्रकार का प्लॉट है जो डेटा सेट का पांच अंकों का सारांश प्रदर्शित करता है, जिसमें शामिल हैं:
- न्यूनतम मूल्य
- प्रथम चतुर्थक (25वाँ प्रतिशतक)
- माध्यिका मान
- तीसरा चतुर्थक (75वाँ प्रतिशतक)
- अधिकतम मूल्य
एक बॉक्स प्लॉट बनाने के लिए, हम पहले से तीसरे चतुर्थक तक एक बॉक्स बनाते हैं। इसके बाद, हम मध्यिका पर एक ऊर्ध्वाधर रेखा खींचते हैं। अंत में, हम न्यूनतम और अधिकतम मान तक चतुर्थक की “मूंछें” खींचते हैं।
बॉक्सप्लॉट उपयोगी हैं क्योंकि वे हमें डेटा सेट में मूल्यों के वितरण को तुरंत समझने की अनुमति देते हैं। वे दो अलग-अलग डेटा सेटों की तुलना करने के लिए भी उपयोगी हैं।
दो या दो से अधिक बॉक्सप्लॉट की तुलना करते समय, हम चार अलग-अलग प्रश्नों का उत्तर दे सकते हैं:
1. माध्यिका मानों की तुलना कैसे की जाती है? हम यह निर्धारित करने के लिए प्रत्येक बॉक्स में ऊर्ध्वाधर रेखा की तुलना कर सकते हैं कि किस डेटा सेट का औसत मूल्य अधिक है।
2. फैलाव की तुलना कैसे की जाती है? हम प्रत्येक बॉक्स की लंबाई की तुलना कर सकते हैं (जो Q1 और Q3 के बीच की दूरी का प्रतिनिधित्व करता है – इंटरक्वेर्टाइल रेंज) यह निर्धारित करने के लिए कि कौन सा डेटा सेट बड़ा है।
3. विषमता की तुलना कैसे की जाती है? ऊर्ध्वाधर रेखा पहली तिमाही के जितनी करीब होगी, डेटा सेट उतना ही अधिक सकारात्मक रूप से तिरछा होगा। ऊर्ध्वाधर रेखा तीसरी तिमाही के जितनी करीब होगी, डेटा सेट उतना ही अधिक तिरछा होगा।
4. क्या आउटलेयर मौजूद हैं? बॉक्स प्लॉट्स में, आउटलेर्स को आमतौर पर छोटे वृत्तों द्वारा दर्शाया जाता है जो प्रत्येक मूंछ से आगे बढ़ते हैं। एक अवलोकन को बाह्य के रूप में परिभाषित किया गया है यदि वह निम्नलिखित मानदंडों में से किसी एक को पूरा करता है:
- एक अवलोकन Q1 – 1.5*IQR से कम है
- एक अवलोकन Q3 + 1.5*IQR से अधिक है
निम्नलिखित उदाहरण दिखाता है कि दो अलग-अलग बॉक्सप्लॉट की तुलना कैसे करें और इन चार प्रश्नों के उत्तर कैसे दें।
उदाहरण: बॉक्स प्लॉट की तुलना करना
निम्नलिखित डेटासेट उन छात्रों के परिणाम प्रदर्शित करते हैं जिन्होंने परीक्षा की तैयारी के लिए दो अध्ययन तकनीकों में से एक का उपयोग किया:
विधि 1: 78, 78, 79, 80, 80, 82, 82, 83, 83, 86, 86, 86, 86, 87, 87, 87, 88, 88, 88, 91
विधि 2: 66, 66, 66, 67, 68, 70, 72, 75, 75, 78, 82, 83, 86, 88, 89, 90, 93, 94, 95, 98
यदि हम प्रत्येक डेटासेट के लिए बॉक्सप्लॉट बनाते हैं, तो वे इस तरह दिखेंगे:
हम इन दोनों बॉक्सप्लॉट की तुलना कर सकते हैं और निम्नलिखित चार प्रश्नों के उत्तर दे सकते हैं:
1. माध्यिका मानों की तुलना कैसे की जाती है? अध्ययन विधि 1 के लिए बॉक्स प्लॉट के बीच की रेखा अध्ययन विधि 2 की रेखा से ऊंची है, जो दर्शाती है कि जिन छात्रों ने अध्ययन विधि 1 का उपयोग किया था, उनका उच्च परीक्षा में औसत ग्रेड था।
2. फैलाव की तुलना कैसे की जाती है? अध्ययन विधि 2 का बॉक्स प्लॉट अध्ययन विधि 1 की तुलना में बहुत लंबा है, जो दर्शाता है कि अध्ययन विधि 2 का उपयोग करने वाले छात्रों के बीच परीक्षा के अंक अधिक वितरित हैं।
3. विषमता की तुलना कैसे की जाती है? अध्ययन विधि 1 के लिए बॉक्स प्लॉट के मध्य की रेखा Q3 के करीब है, जो दर्शाती है कि अध्ययन विधि 1 का उपयोग करने वाले छात्रों के लिए परीक्षा अंकों का वितरण नकारात्मक रूप से विषम है। इसके विपरीत, अध्ययन विधि 2 के लिए बॉक्स प्लॉट के मध्य की रेखा बॉक्स के केंद्र के करीब है, जिसका अर्थ है कि अंकों का वितरण न्यूनतम रूप से विषम है।
4. क्या आउटलेयर मौजूद हैं? किसी भी बॉक्सप्लॉट में छोटे वृत्त नहीं हैं जो ऊपर या नीचे की मूंछों से आगे बढ़ते हैं, जिसका अर्थ है कि किसी भी डेटा सेट में स्पष्ट आउटलेयर नहीं हैं।
अतिरिक्त संसाधन
एक्सेल में बॉक्स प्लॉट्स कैसे बनाएं और व्याख्या करें
एसपीएसएस में बॉक्स प्लॉट कैसे बनाएं और व्याख्या करें
आर में मल्टीपल बॉक्स प्लॉट कैसे बनाएं
स्टाटा में बॉक्स प्लॉट कैसे बनाएं और व्याख्या करें