एसएएस में डुप्लिकेट कैसे हटाएं (उदाहरण के साथ)
डेटा सेट से डुप्लिकेट पंक्तियों को तुरंत हटाने के लिए आप SAS में proc sort का उपयोग कर सकते हैं।
यह प्रक्रिया निम्नलिखित मूल वाक्यविन्यास का उपयोग करती है:
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run;
ध्यान दें कि बाय तर्क निर्दिष्ट करता है कि डुप्लिकेट हटाते समय कौन से कॉलम को स्कैन करना है।
निम्नलिखित उदाहरण दिखाते हैं कि एसएएस में निम्नलिखित डेटा सेट से डुप्लिकेट को कैसे हटाया जाए:
/*create dataset*/
data original_data;
input team $position $points;
datalines ;
A Guard 12
A Guard 20
A Guard 20
A Guard 24
A Forward 15
A Forward 15
A Forward 19
A Forward 28
B Guard 10
B Guard 12
B Guard 12
B Guard 26
B Forward 10
B Forward 10
B Forward 10
B Forward 19
;
run ;
/*view dataset*/
proc print data = original_data;
उदाहरण 1: सभी स्तंभों से डुप्लिकेट हटाएँ
डेटासेट में सभी कॉलमों में डुप्लिकेट मान वाली पंक्तियों को हटाने के लिए हम निम्नलिखित कोड का उपयोग कर सकते हैं:
/*create dataset with no duplicate rows*/
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run ;
/*view dataset with no duplicate rows*/
proc print data =no_dups_data;
ध्यान दें कि मूल डेटासेट से कुल पाँच डुप्लिकेट पंक्तियाँ हटा दी गई थीं।
उदाहरण 2: विशिष्ट स्तंभों से डुप्लिकेट हटाएँ
डुप्लिकेट को हटाते समय कौन से कॉलम की जांच करनी है यह निर्दिष्ट करने के लिए हम बाय तर्क का उपयोग कर सकते हैं।
उदाहरण के लिए, निम्न कोड टीम और स्थिति कॉलम में डुप्लिकेट मान वाली पंक्तियों को हटा देता है:
/*create dataset with no duplicate rows in team and position columns*/
proc sort data =original_data out =no_dups_data nodupkey ;
by team position;
run ;
/*view dataset with no duplicate rows in team and position columns*/
proc print data =no_dups_data;
टीम और स्थिति कॉलम में डुप्लिकेट मान वाली पंक्तियों को हटाने के बाद डेटासेट में केवल चार पंक्तियाँ शेष रहती हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि एसएएस में अन्य सामान्य ऑपरेशन कैसे करें:
एसएएस में डेटा को सामान्य कैसे करें
एसएएस में आउटलेर्स की पहचान कैसे करें
एसएएस में प्रक्रिया सारांश का उपयोग कैसे करें
एसएएस में फ़्रीक्वेंसी टेबल कैसे बनाएं