एसएएस में क्यूक्यू प्लॉट कैसे बनाएं


एक QQ प्लॉट, जिसका संक्षिप्त रूप “क्वांटाइल-क्वांटाइल” है, का उपयोग यह मूल्यांकन करने के लिए किया जाता है कि डेटा सेट संभावित रूप से सैद्धांतिक वितरण से आता है या नहीं।

ज्यादातर मामलों में, इस प्रकार के प्लॉट का उपयोग यह निर्धारित करने के लिए किया जाता है कि डेटा सेट सामान्य वितरण का पालन करता है या नहीं।

यदि डेटा सामान्य रूप से वितरित किया जाता है, तो QQ प्लॉट पर बिंदु एक सीधी विकर्ण रेखा पर स्थित होंगे।

इसके विपरीत, ग्राफ़ पर जितने अधिक महत्वपूर्ण बिंदु एक सीधी विकर्ण रेखा से विचलित होते हैं, डेटा सेट के सामान्य वितरण का पालन करने की संभावना उतनी ही कम होती है।

SAS में QQ प्लॉट बनाने का सबसे आसान तरीका QQPLOT स्टेटमेंट के साथ PROC UNIVARIATE स्टेटमेंट का उपयोग करना है:

 proc univariate data =my_data noprint ;
   qqplot my_variable;
run ;

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

ध्यान दें : हम PROC UNIVARIATE स्टेटमेंट द्वारा स्वचालित रूप से उत्पन्न अन्य सभी सारांश आँकड़ों और तालिकाओं को हटाने के लिए NOPRINT स्टेटमेंट का उपयोग करते हैं।

उदाहरण 1: सामान्य डेटा के लिए एसएएस में एक क्यूक्यू प्लॉट बनाएं

निम्नलिखित कोड दिखाता है कि 10 के माध्य और 2 के मानक विचलन के साथ सामान्य वितरण से उत्पन्न 1000 अवलोकन वाले डेटा सेट के लिए QQ प्लॉट कैसे बनाया जाए:

 /*generate 1000 values that follow normal distribution with mean 10 and sd 2 */
data normal_data;
    do i = 1 to 1000;
	x = 10 + 2* rannor (1);
        output ;
    end ;
run ;

/*create some plot*/
proc univariate data =normal_data noprint ;
   qqplot x;
run ; 

एसएएस में क्यूक्यू प्लॉट

हम देख सकते हैं कि बिंदु अधिकतर एक सीधी विकर्ण रेखा पर स्थित होते हैं और प्रत्येक छोर पर कुछ छोटे विचलन होते हैं।

इस ग्राफ़ के आधार पर, हम सुरक्षित रूप से मान सकते हैं कि यह डेटासेट सामान्य रूप से वितरित है।

उदाहरण 2: गैर-सामान्य डेटा के लिए QQ प्लॉट

निम्नलिखित कोड दिखाता है कि घातीय वितरण से उत्पन्न 1000 अवलोकनों वाले डेटासेट के लिए QQ प्लॉट कैसे बनाया जाए:

 /*generate 1000 values that follow an exponential distribution*/
data exp_data;
    do i = 1 to 1000;
	x = ranexp (1);
        output ;
    end ;
run ;

/*create some plot*/
proc univariate data =exp_data noprint ;
   qqplot x;
run ; 

मैं देखता हूं कि बिंदु एक सीधी विकर्ण रेखा से महत्वपूर्ण रूप से विचलित होते हैं। यह स्पष्ट रूप से इंगित करता है कि डेटासेट सामान्य रूप से वितरित नहीं है।

यह समझ में आना चाहिए कि हमने निर्दिष्ट किया है कि डेटा को एक घातांकीय वितरण का पालन करना चाहिए।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि एसएएस में अन्य सामान्य कार्य कैसे करें:

एसएएस में सामान्यता परीक्षण के लिए प्रोक यूनीवेरिएट का उपयोग कैसे करें
एसएएस में लॉग ट्रांसफॉर्मेशन कैसे करें
एसएएस में आउटलेर्स की पहचान कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *