आर में डुप्लिकेट लाइनें कैसे हटाएं ताकि कोई भी न बचे


आप डेटा फ़्रेम से डुप्लिकेट पंक्तियों को हटाने के लिए R में निम्नलिखित विधियों का उपयोग कर सकते हैं ताकि परिणामी डेटा फ़्रेम में कोई भी न रहे:

विधि 1: बेस आर का उपयोग करें

 new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]

विधि 2: dplyr का उपयोग करें

 library (dplyr)

new_df <- df %>%
          group_by(across(everything())) %>%
          filter(n() == 1 )

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित डेटा फ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(20, 20, 28, 14, 13, 18, 27, 13))

#view data frame
df

  team points
1 to 20
2 to 20
3 to 28
4 to 14
5 B 13
6 B 18
7 B 27
8 B 13

उदाहरण 1: बेस आर का उपयोग करें

निम्नलिखित कोड दिखाता है कि डेटा फ्रेम से डुप्लिकेट पंक्तियों को हटाने के लिए आर बेस फ़ंक्शन का उपयोग कैसे करें ताकि कोई भी न रहे:

 #create new data frame that removes duplicates so none are left
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]

#view new data frame
new_df

  team points
3 to 28
4 to 14
6 B 18
7 B 27

ध्यान दें कि प्रत्येक डुप्लिकेट पंक्ति को डेटा फ़्रेम से हटा दिया गया है और कोई भी डुप्लिकेट बरकरार नहीं रखा गया है।

उदाहरण 2: dplyr का उपयोग करना

निम्नलिखित कोड दिखाता है कि डेटा फ्रेम से डुप्लिकेट पंक्तियों को हटाने के लिए आर में dplyr पैकेज में फ़ंक्शन का उपयोग कैसे करें ताकि कोई भी न रहे:

 library (dplyr)

#create new data frame that removes duplicates so none are left
new_df <- df %>%
          group_by(across(everything())) %>%
          filter(n() == 1 )

#view new data frame
new_df

# A tibble: 4 x 2
# Groups: team, points [4]
  team points
    
1 to 28
2 to 14
3 B 18
4 B 27

ध्यान दें कि प्रत्येक डुप्लिकेट पंक्ति को डेटा फ़्रेम से हटा दिया गया है और कोई भी डुप्लिकेट बरकरार नहीं रखा गया है।

यह भी ध्यान दें कि यह पिछली विधि के समान ही परिणाम देता है।

नोट : अत्यधिक बड़े डेटा फ़्रेम के लिए, dplyr विधि बेस R विधि से तेज़ होगी।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

शर्त के आधार पर R में पंक्तियाँ कैसे हटाएँ
R में किसी विशिष्ट कॉलम में NA वाली पंक्तियों को कैसे हटाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *