आर में डेटा फ़्रेम में एकल पंक्तियों का चयन कैसे करें
आप R में डेटा फ़्रेम में एकल पंक्तियों का चयन करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:
विधि 1: सभी कॉलमों में एकल पंक्तियों का चयन करें
library (dplyr)
df %>% distinct()
विधि 2: कॉलम के आधार पर एकल पंक्तियों का चयन करें
library (dplyr)
df %>% distinct(column1, . keep_all = TRUE )
विधि 3: एकाधिक स्तंभों के आधार पर एकल पंक्तियों का चयन करें
library (dplyr)
df %>% distinct(column1, column2, . keep_all = TRUE )
यह ट्यूटोरियल बताता है कि निम्नलिखित डेटा फ्रेम के साथ अभ्यास में प्रत्येक विधि का उपयोग कैसे करें:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
points=c(10, 10, 8, 14, 15, 15, 17, 17))
#view data frame
df
team position points
1 AG 10
2 AG 10
3AF 8
4 AF 14
5 BG 15
6 BG 15
7 BF 17
8 BF 17
उदाहरण 1: सभी स्तंभों में अद्वितीय पंक्तियों का चयन करें
निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम में सभी कॉलमों में अद्वितीय मानों वाली पंक्तियों का चयन कैसे करें:
library (dplyr)
#select rows with unique values across all columns
df %>% distinct()
team position points
1 AG 10
2AF 8
3 AF 14
4 BG 15
5 BF 17
हम देख सकते हैं कि डेटा फ़्रेम में पाँच अद्वितीय पंक्तियाँ हैं।
नोट : जब डुप्लिकेट पंक्तियाँ सामने आती हैं, तो केवल पहली अद्वितीय पंक्ति ही बरकरार रखी जाती है।
उदाहरण 2: कॉलम के आधार पर एकल पंक्तियाँ चुनें
निम्नलिखित कोड दिखाता है कि केवल टीम कॉलम के आधार पर एकल पंक्तियों का चयन कैसे करें।
library (dplyr)
#select rows with unique values based on team column only
df %>% distinct(team, . keep_all = TRUE )
team position points
1 AG 10
2 BG 15
चूँकि टीम कॉलम में केवल दो अद्वितीय मान हैं, केवल प्रत्येक मान की पहली घटना वाली पंक्तियाँ ही रखी जाती हैं।
ध्यान दें : .keep_all=TRUE तर्क R को आउटपुट में अन्य सभी कॉलम रखने के लिए कहता है।
उदाहरण 3: एकाधिक स्तंभों के आधार पर एकल पंक्तियों का चयन करें
निम्नलिखित कोड दिखाता है कि केवल टीम और स्थिति कॉलम के आधार पर एकल पंक्तियों का चयन कैसे करें।
library (dplyr)
#select rows with unique values based on team and position columns only
df %>% distinct(team, position, . keep_all = TRUE )
team position points
1 AG 10
2AF 8
3 BG 15
4 BF 17
चार पंक्तियाँ लौटा दी गई हैं क्योंकि टीम और स्थिति कॉलम में मानों के चार अद्वितीय संयोजन हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:
Dplyr का उपयोग करके अद्वितीय मानों को कैसे फ़िल्टर करें
Dplyr का उपयोग करके अनेक स्थितियों के आधार पर फ़िल्टर कैसे करें
आर में कॉलम में घटनाओं की संख्या की गणना कैसे करें