Ggplot2 का उपयोग करके r में समूहीकृत बॉक्सप्लॉट कैसे बनाएं
बॉक्सप्लॉट डेटा सेट के पांच अंकों के सारांश को देखने के लिए उपयोगी हैं, जिसमें शामिल हैं:
- न्यूनतम
- प्रथम चतुर्थक
- मध्यस्थ
- तृतीय चतुर्थक
- अधिकतम
संबंधित: बॉक्सप्लॉट्स का एक सौम्य परिचय
सौभाग्य से, ggplot2 विज़ुअलाइज़ेशन लाइब्रेरी का उपयोग करके R में बॉक्सप्लॉट बनाना आसान है।
इसमें डेटासेट में किसी विशेष वेरिएबल द्वारा समूहीकृत बॉक्सप्लॉट बनाना भी शामिल है। उदाहरण के लिए, मान लें कि हमारे पास निम्नलिखित डेटासेट है जो दो अलग-अलग प्रशिक्षण कार्यक्रमों के आधार पर तीन अलग-अलग टीमों के 150 बास्केटबॉल खिलाड़ियों की दक्षता में वृद्धि प्रदर्शित करता है:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
हम बॉक्सप्लॉट बनाने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं जो टीम द्वारा समूहीकृत और प्रशिक्षण कार्यक्रम के आधार पर खिलाड़ियों की दक्षता में वृद्धि को प्रदर्शित करता है:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
हम बॉक्सप्लॉट बनाने के लिए समान सिंटैक्स का उपयोग कर सकते हैं जो खिलाड़ी दक्षता में वृद्धि को प्रदर्शित करता है, प्रशिक्षण कार्यक्रम द्वारा समूहीकृत और टीम द्वारा पॉप्युलेट किया जाता है:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
एक समान विकल्प फेसटिंग का उपयोग करना है, जिसमें प्रत्येक उपसमूह को अपने स्वयं के पैनल में प्रदर्शित किया जाता है:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
आप जिस डेटा के साथ काम कर रहे हैं, उसके आधार पर पहलू बनाना आपकी विज़ुअलाइज़ेशन आवश्यकताओं को पूरा कर भी सकता है और नहीं भी।
अतिरिक्त संसाधन
आर में बॉक्सप्लॉट्स में आउटलेर्स को कैसे हटाएं
Ggplot2 में साइड-बाय-साइड प्लॉट कैसे बनाएं
सर्वोत्तम ggplot2 थीम के लिए एक संपूर्ण मार्गदर्शिका