उ: जांचें कि क्या एक डेटा फ़्रेम की पंक्ति दूसरे में मौजूद है


आप R में डेटा फ़्रेम में एक नया कॉलम जोड़ने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं जो इंगित करता है कि प्रत्येक पंक्ति किसी अन्य डेटा फ़्रेम में मौजूद है या नहीं:

 df1$exists <- do. call (paste0, df1) %in% do. call (paste0, df2)

यह विशेष सिंटैक्स df1 नामक डेटा फ़्रेम में अस्तित्व नामक एक कॉलम जोड़ता है जिसमें TRUE या FALSE होता है जो यह दर्शाता है कि df1 में प्रत्येक पंक्ति df2 नामक किसी अन्य डेटा फ़्रेम में मौजूद है या नहीं।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: जांचें कि क्या एक डेटा फ्रेम की पंक्ति आर में दूसरे में मौजूद है

मान लीजिए कि हमारे पास R में निम्नलिखित दो डेटा फ़्रेम हैं:

 #create first data frame
df1 <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                  dots=c(12, 15, 22, 29, 24))

#view first data frame
df1

  team points
1 to 12
2 B 15
3 C 22
4 D 29
5 E 24

#create second data frame
df2 <- data. frame (team=c('A', 'D', 'F', 'G', 'H'),
                  dots=c(12, 29, 15, 19, 10))

#view second data frame
df2

  team points
1 to 12
2 D 29
3 F 15
4 G 19
5:10 a.m.

हम पहले डेटा फ़्रेम में मौजूद नामक कॉलम जोड़ने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं जो इंगित करता है कि प्रत्येक पंक्ति दूसरे डेटा फ़्रेम में मौजूद है या नहीं:

 #add new column to df1 that shows if row exists in df2
df1$exists <- do. call (paste0, df1) %in% do. call (paste0, df2)

#view updated data frame
df1

  team points exists
1 TO 12 TRUE
2 B 15 FALSE
3 C 22 FALSE
4 D 29 TRUE
5 E 24 FALSE

नया कॉलम मौजूद है यह दर्शाता है कि पहले डेटा फ़्रेम की प्रत्येक पंक्ति दूसरे डेटा फ़्रेम में मौजूद है या नहीं।

परिणाम से हम देख सकते हैं:

  • df1 की पहली पंक्ति df2 में मौजूद है।
  • df1 की दूसरी पंक्ति df2 में मौजूद नहीं है।
  • df1 की तीसरी पंक्ति df2 में मौजूद नहीं है।

और इसी तरह।

ध्यान दें कि आप मौजूदा कॉलम में TRUE या FALSE के बजाय 1s और 0s प्रदर्शित करने के लिए is.numeric() का भी उपयोग कर सकते हैं:

 #add new column to df1 that shows if row exists in df2
df1$exists <- as. numeric (do. call (paste0, df1) %in% do. call (paste0, df2))

#view updated data frame
df1

  team points exists
1 to 12 1
2 B 15 0
3 C 22 0
4 D 29 1
5 E 24 0

1 का मान इंगित करता है कि पहले डेटा ब्लॉक की पंक्ति दूसरे में मौजूद है।

इसके विपरीत, 0 का मान इंगित करता है कि पहले डेटा फ़्रेम में पंक्ति दूसरे में मौजूद नहीं है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

ए: कैसे जांचें कि एकाधिक कॉलम बराबर हैं या नहीं
ए: डेटा फ़्रेम में एकल पंक्तियों का चयन कैसे करें
ए: डेटा फ़्रेम में पंक्तियों को कैसे दोहराया जाए

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *