आर में जोड़ी प्लॉट कैसे बनाएं और व्याख्या करें
एक जोड़ी प्लॉट एक स्कैटरप्लॉट मैट्रिक्स है जो आपको डेटा सेट में विभिन्न चर के बीच जोड़ीदार संबंध को समझने की अनुमति देता है।
सौभाग्य से, पेयर() फ़ंक्शन का उपयोग करके आर में पेयर प्लॉट बनाना आसान है। यह ट्यूटोरियल इस फ़ंक्शन के व्यावहारिक उपयोग के कई उदाहरण प्रदान करता है।
उदाहरण 1: सभी चरों का युग्म आलेख
निम्नलिखित कोड दर्शाता है कि R में डेटा फ़्रेम में सभी वेरिएबल्स के लिए बेस पेयर प्लॉट कैसे बनाया जाए:
#make this example reproducible set.seed(0) #create data frame var1 <- rnorm(1000) var2 <- var1 + rnorm(1000, 0, 2) var3 <- var2 - rnorm(1000, 0, 5) df <- data.frame(var1, var2, var3) #create pairs plot peers(df)
मैट्रिक्स की व्याख्या करने का तरीका इस प्रकार है:
- परिवर्तनीय नाम विकर्ण बक्सों के साथ प्रदर्शित होते हैं।
- अन्य सभी बॉक्स चरों के प्रत्येक जोड़ीवार संयोजन के बीच संबंध का एक स्कैटरप्लॉट प्रदर्शित करते हैं। उदाहरण के लिए, मैट्रिक्स के ऊपरी दाएं कोने में क्षेत्र var1 और var3 के लिए मानों का एक स्कैटरप्लॉट प्रदर्शित करता है। मध्य बायाँ बॉक्स var1 और var2 इत्यादि के लिए मानों का एक स्कैटरप्लॉट प्रदर्शित करता है।
यह एकल ग्राफ़ हमें हमारे डेटा सेट में चर की प्रत्येक जोड़ी के बीच संबंध का एक विचार देता है। उदाहरण के लिए, var1 और var2 सकारात्मक रूप से सहसंबद्ध प्रतीत होते हैं जबकि var1 और var3 में बहुत कम या कोई सहसंबंध नहीं होता है।
उदाहरण 2: विशिष्ट चरों के जोड़े आलेखित करना
निम्नलिखित कोड दर्शाता है कि डेटा सेट में केवल पहले दो वेरिएबल्स के लिए बेस पेयर प्लॉट कैसे बनाया जाए:
#create pairs plot for var1 and var2 only
even(df[, 1:2])
उदाहरण 3: युगल कथानक के सौंदर्यशास्त्र को बदलें
निम्नलिखित कोड दर्शाता है कि शीर्षक, रंग और लेबल सहित युगल कथानक के सौंदर्यशास्त्र को कैसे बदला जाए:
peers(df, col = ' blue ', #modify color labels = c(' First ', ' Second ', ' Third '), #modify labels main = ' Custom Title ') #modify title
उदाहरण 4: ggpairs के साथ सहसंबंध प्राप्त करना
आप GGally लाइब्रेरी से ggpairs() फ़ंक्शन का उपयोग करके चरों के बीच पियर्सन सहसंबंध गुणांक भी प्राप्त कर सकते हैं। निम्नलिखित कोड दर्शाता है कि इस फ़ंक्शन का उपयोग कैसे करें:
#install necessary libraries install.packages('ggplot2') install.packages('GGally') #load libraries library(ggplot2) library(GGally) #create pairs plot ggpairs(df)
इस मैट्रिक्स की व्याख्या करने का तरीका इस प्रकार है:
- परिवर्तनीय नाम मैट्रिक्स के बाहरी किनारों पर प्रदर्शित होते हैं।
- विकर्णों के साथ बॉक्स प्रत्येक चर के लिए घनत्व प्लॉट प्रदर्शित करते हैं।
- निचले बाएँ कोने में स्थित बॉक्स प्रत्येक चर के बीच स्कैटरप्लॉट प्रदर्शित करते हैं।
- ऊपरी दाएं कोने में स्थित बॉक्स प्रत्येक चर के बीच पियर्सन सहसंबंध गुणांक प्रदर्शित करते हैं। उदाहरण के लिए, var1 और var2 के बीच सहसंबंध 0.425 है।
बुनियादी आर जोड़े() फ़ंक्शन पर ggpairs() का उपयोग करने का लाभ यह है कि आप चर के बारे में अधिक जानकारी प्राप्त कर सकते हैं। विशेष रूप से, आप चर के प्रत्येक जोड़ीवार संयोजन के साथ-साथ प्रत्येक व्यक्तिगत चर के लिए घनत्व प्लॉट के बीच सहसंबंध गुणांक देख सकते हैं।
आप ggpairs() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ यहां पा सकते हैं।