Ggplot2 में qq प्लॉट कैसे बनाएं (उदाहरण के साथ)


एक QQ प्लॉट, जिसका संक्षिप्त रूप “क्वांटाइल-क्वांटाइल” है, का उपयोग यह मूल्यांकन करने के लिए किया जाता है कि डेटा सेट संभावित रूप से सैद्धांतिक वितरण से आता है या नहीं।

ज्यादातर मामलों में, इस प्रकार के प्लॉट का उपयोग यह निर्धारित करने के लिए किया जाता है कि डेटा सेट सामान्य वितरण का पालन करता है या नहीं।

यदि डेटा सामान्य रूप से वितरित किया जाता है, तो QQ प्लॉट पर बिंदु एक सीधी विकर्ण रेखा पर स्थित होंगे।

इसके विपरीत, यदि बिंदु सीधी विकर्ण रेखा से महत्वपूर्ण रूप से विचलित होते हैं, तो डेटा के सामान्य रूप से वितरित होने की संभावना कम होती है।

Ggplot2 में QQ प्लॉट बनाने के लिए, आप stat_qq() और stat_qq_line() फ़ंक्शन का उपयोग निम्नानुसार कर सकते हैं:

 library (ggplot2)

ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

निम्नलिखित उदाहरण दिखाते हैं कि दो अलग-अलग परिदृश्यों में QQ प्लॉट बनाने के लिए इस सिंटैक्स का उपयोग कैसे करें।

उदाहरण 1: सामान्य डेटा के लिए QQ प्लॉट

निम्नलिखित कोड दिखाता है कि 200 अवलोकनों के साथ सामान्य रूप से वितरित डेटासेट कैसे उत्पन्न किया जाए और आर में डेटासेट के लिए क्यूक्यू प्लॉट कैसे बनाया जाए:

 library (ggplot2)

#make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
df <- data. frame (y=rnorm(200))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

ggplot2 में QQ प्लॉट

हम देख सकते हैं कि बिंदु मुख्य रूप से सीधी विकर्ण रेखा के साथ-साथ प्रत्येक पूंछ के साथ कुछ मामूली विचलन के साथ स्थित हैं।

इस ग्राफ़ के आधार पर, हम मान लेंगे कि यह डेटासेट सामान्य रूप से वितरित है।

ध्यान दें कि यदि हम चाहें तो प्लॉट में बिंदुओं के रंग और आकार को बदलने के लिए हम रंग और आकार तर्कों का भी उपयोग कर सकते हैं:

 library (ggplot2)

#make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
df <- data. frame (y=rnorm(200))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq(size= 2.5 , color=' red ') + 
  stat_qq_line() 

उदाहरण 2: गैर-सामान्य डेटा के लिए QQ प्लॉट

निम्नलिखित कोड दिखाता है कि डेटा सेट के लिए QQ प्लॉट कैसे बनाया जाए जो 200 अवलोकनों के साथ एक घातांकीय वितरण का अनुसरण करता है:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
df <- data. frame (y=rexp( 200 , rate= 3 ))

#create QQ plot
ggplot(df, aes(sample=y)) +
  stat_qq() + 
  stat_qq_line()

हम देखते हैं कि बिंदु विकर्ण रेखा से काफी विचलन करते हैं। यह स्पष्ट रूप से इंगित करता है कि डेटासेट सामान्य रूप से वितरित नहीं है।

यह समझ में आना चाहिए कि हमने निर्दिष्ट किया है कि डेटा को एक घातांकीय वितरण का पालन करना चाहिए।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि ggplot2 में अन्य सामान्य कार्य कैसे करें:

Ggplot2 में एकाधिक पंक्तियाँ कैसे प्लॉट करें
Ggplot2 में माध्य और मानक विचलन कैसे प्लॉट करें
Ggplot2 में लाइन का रंग कैसे बदलें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *