Dplyr: बेजोड़ रिकॉर्ड खोजने के लिए एंटी_जॉइन का उपयोग कैसे करें
आप डेटा फ़्रेम में उन सभी पंक्तियों को वापस करने के लिए R में dplyr पैकेज से एंटी_जॉइन () फ़ंक्शन का उपयोग कर सकते हैं जिनके पास किसी अन्य डेटा फ़्रेम में मेल खाने वाले मान नहीं हैं।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
anti_join(df1, df2, by= ' col_name ')
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण 1: एक कॉलम के साथ एंटी_जॉइन() का उपयोग करें
मान लीजिए कि हमारे पास R में निम्नलिखित दो डेटा फ़्रेम हैं:
#create data frames df1 <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), dots=c(12, 14, 19, 24, 36)) df2 <- data. frame (team=c('A', 'B', 'C', 'F', 'G'), dots=c(12, 14, 19, 33, 17))
हम पहले डेटा फ्रेम में उन सभी पंक्तियों को वापस करने के लिए एंटी_जॉइन () फ़ंक्शन का उपयोग कर सकते हैं जिनके पास दूसरे डेटा फ्रेम में मेल खाने वाली टीम नहीं है:
library (dplyr) #perform anti join using 'team' column anti_join(df1, df2, by=' team ') team points 1 D 24 2 E 36
हम देख सकते हैं कि पहले डेटा फ्रेम से बिल्कुल दो टीमें हैं जिनके पास दूसरे डेटा फ्रेम में मेल खाने वाली टीम का नाम नहीं है।
उदाहरण 2: एकाधिक कॉलमों के साथ एंटी_जॉइन() का उपयोग करें
मान लीजिए कि हमारे पास R में निम्नलिखित दो डेटा फ़्रेम हैं:
#create data frames df1 <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'G', 'F', 'C'), dots=c(12, 14, 19, 24, 36, 41)) df2 <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('G', 'G', 'C', 'G', 'F', 'F'), dots=c(12, 14, 19, 33, 17, 22))
हम पहले डेटा फ्रेम में सभी पंक्तियों को वापस करने के लिए एंटी_जॉइन () फ़ंक्शन का उपयोग कर सकते हैं, जिसमें दूसरे डेटा फ्रेम में मेल खाने वाली टीम और स्थिति नहीं है:
library (dplyr) #perform anti join using 'team' and 'position' columns anti_join(df1, df2, by=c(' team ', ' position ')) team position points 1 FY 19 2 BC 41
हम देख सकते हैं कि पहले डेटा फ्रेम से ठीक दो रिकॉर्ड हैं जिनमें दूसरे डेटा फ्रेम में मेल खाने वाली टीम का नाम और स्थिति नहीं है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि dplyr में अन्य सामान्य कार्य कैसे करें:
Dplyr का उपयोग करके इंडेक्स द्वारा कॉलम का चयन कैसे करें
Dplyr का उपयोग करके एकाधिक डेटा फ़्रेमों को कैसे जोड़ें
Dplyr का उपयोग करके एक निश्चित स्ट्रिंग वाली पंक्तियों को कैसे फ़िल्टर करें