Dplyr: बेजोड़ रिकॉर्ड खोजने के लिए एंटी_जॉइन का उपयोग कैसे करें


आप डेटा फ़्रेम में उन सभी पंक्तियों को वापस करने के लिए R में dplyr पैकेज से एंटी_जॉइन () फ़ंक्शन का उपयोग कर सकते हैं जिनके पास किसी अन्य डेटा फ़्रेम में मेल खाने वाले मान नहीं हैं।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

 anti_join(df1, df2, by= ' col_name ')

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण 1: एक कॉलम के साथ एंटी_जॉइन() का उपयोग करें

मान लीजिए कि हमारे पास R में निम्नलिखित दो डेटा फ़्रेम हैं:

 #create data frames
df1 <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                  dots=c(12, 14, 19, 24, 36))

df2 <- data. frame (team=c('A', 'B', 'C', 'F', 'G'),
                  dots=c(12, 14, 19, 33, 17))

हम पहले डेटा फ्रेम में उन सभी पंक्तियों को वापस करने के लिए एंटी_जॉइन () फ़ंक्शन का उपयोग कर सकते हैं जिनके पास दूसरे डेटा फ्रेम में मेल खाने वाली टीम नहीं है:

 library (dplyr)

#perform anti join using 'team' column
anti_join(df1, df2, by=' team ')

  team points
1 D 24
2 E 36

हम देख सकते हैं कि पहले डेटा फ्रेम से बिल्कुल दो टीमें हैं जिनके पास दूसरे डेटा फ्रेम में मेल खाने वाली टीम का नाम नहीं है।

उदाहरण 2: एकाधिक कॉलमों के साथ एंटी_जॉइन() का उपयोग करें

मान लीजिए कि हमारे पास R में निम्नलिखित दो डेटा फ़्रेम हैं:

 #create data frames
df1 <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                  position=c('G', 'G', 'F', 'G', 'F', 'C'),
                  dots=c(12, 14, 19, 24, 36, 41))

df2 <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                  position=c('G', 'G', 'C', 'G', 'F', 'F'),
                  dots=c(12, 14, 19, 33, 17, 22))

हम पहले डेटा फ्रेम में सभी पंक्तियों को वापस करने के लिए एंटी_जॉइन () फ़ंक्शन का उपयोग कर सकते हैं, जिसमें दूसरे डेटा फ्रेम में मेल खाने वाली टीम और स्थिति नहीं है:

 library (dplyr)

#perform anti join using 'team' and 'position' columns
anti_join(df1, df2, by=c(' team ', ' position '))

  team position points
1 FY 19
2 BC 41

हम देख सकते हैं कि पहले डेटा फ्रेम से ठीक दो रिकॉर्ड हैं जिनमें दूसरे डेटा फ्रेम में मेल खाने वाली टीम का नाम और स्थिति नहीं है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि dplyr में अन्य सामान्य कार्य कैसे करें:

Dplyr का उपयोग करके इंडेक्स द्वारा कॉलम का चयन कैसे करें
Dplyr का उपयोग करके एकाधिक डेटा फ़्रेमों को कैसे जोड़ें
Dplyr का उपयोग करके एक निश्चित स्ट्रिंग वाली पंक्तियों को कैसे फ़िल्टर करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *