R में चतुर्थक कैसे खोजें और विज़ुअलाइज़ करें
चतुर्थक वे मान हैं जो डेटा सेट को चार बराबर भागों में विभाजित करते हैं।
- पहला चतुर्थक डेटा सेट के 25वें प्रतिशतक का प्रतिनिधित्व करता है।
- दूसरा चतुर्थक डेटा सेट के 50वें प्रतिशतक का प्रतिनिधित्व करता है। यह मान डेटासेट के औसत मान के बराबर है।
- तीसरा चतुर्थक डेटा सेट के 75वें प्रतिशतक का प्रतिनिधित्व करता है।
हम quantile() फ़ंक्शन का उपयोग करके R में दिए गए डेटासेट के चतुर्थक की आसानी से गणना कर सकते हैं।
यह ट्यूटोरियल व्यवहार में इस सुविधा का उपयोग कैसे करें इसके उदाहरण प्रदान करता है।
आर में चतुर्थक की गणना
निम्नलिखित कोड दिखाता है कि आर में दिए गए डेटासेट के चतुर्थक की गणना कैसे करें:
#define dataset data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33) #calculate quartiles of dataset quantile(data) 0% 25% 50% 75% 100% 4.0 13.5 16.0 24.5 33.0
यहां परिणाम की व्याख्या करने का तरीका बताया गया है:
- पहला मान डेटासेट में न्यूनतम मान प्रदर्शित करता है: 4.0
- दूसरा मान डेटासेट का पहला चतुर्थक प्रदर्शित करता है: 13.5
- तीसरा मान डेटासेट का दूसरा चतुर्थक प्रदर्शित करता है: 16.0
- चौथा मान डेटासेट के तीसरे चतुर्थक को प्रदर्शित करता है: 24.5
- पाँचवाँ मान डेटासेट में अधिकतम मान दिखाता है: 33.0
संबंधित: आर में परसेंटाइल की आसानी से गणना कैसे करें
आर में चतुर्थक की कल्पना करना
हम आर में इस डेटासेट के चतुर्थक को देखने के लिए बॉक्सप्लॉट बनाने के लिए बॉक्सप्लॉट() फ़ंक्शन का उपयोग कर सकते हैं:
#create boxplot
boxplot(data)
यहां बॉक्सप्लॉट की व्याख्या करने का तरीका बताया गया है:
- निचला “व्हिस्कर” 4 का न्यूनतम मान प्रदर्शित करता है।
- बॉक्स की निचली पंक्ति 13.5 का पहला चतुर्थक मान प्रदर्शित करती है।
- बॉक्स के मध्य में काली पट्टी 16.0 का दूसरा चतुर्थक मान प्रदर्शित करती है।
- बॉक्स की शीर्ष पंक्ति 24.5 का तीसरा चतुर्थक मान प्रदर्शित करती है।
- ऊपरी “व्हिस्कर” 33.0 का अधिकतम मान दर्शाता है।
यह अनोखा प्लॉट हमें डेटासेट में मूल्यों के वितरण की त्वरित कल्पना करने में मदद करता है।
संबंधित: आर में एक ही चार्ट में एकाधिक बॉक्स प्लॉट कैसे प्लॉट करें