आर में डुप्लिकेट लाइनें कैसे हटाएं ताकि कोई भी न बचे
आप डेटा फ़्रेम से डुप्लिकेट पंक्तियों को हटाने के लिए R में निम्नलिखित विधियों का उपयोग कर सकते हैं ताकि परिणामी डेटा फ़्रेम में कोई भी न रहे:
विधि 1: बेस आर का उपयोग करें
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]
विधि 2: dplyr का उपयोग करें
library (dplyr) new_df <- df %>% group_by(across(everything())) %>% filter(n() == 1 )
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित डेटा फ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), points=c(20, 20, 28, 14, 13, 18, 27, 13)) #view data frame df team points 1 to 20 2 to 20 3 to 28 4 to 14 5 B 13 6 B 18 7 B 27 8 B 13
उदाहरण 1: बेस आर का उपयोग करें
निम्नलिखित कोड दिखाता है कि डेटा फ्रेम से डुप्लिकेट पंक्तियों को हटाने के लिए आर बेस फ़ंक्शन का उपयोग कैसे करें ताकि कोई भी न रहे:
#create new data frame that removes duplicates so none are left
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]
#view new data frame
new_df
team points
3 to 28
4 to 14
6 B 18
7 B 27
ध्यान दें कि प्रत्येक डुप्लिकेट पंक्ति को डेटा फ़्रेम से हटा दिया गया है और कोई भी डुप्लिकेट बरकरार नहीं रखा गया है।
उदाहरण 2: dplyr का उपयोग करना
निम्नलिखित कोड दिखाता है कि डेटा फ्रेम से डुप्लिकेट पंक्तियों को हटाने के लिए आर में dplyr पैकेज में फ़ंक्शन का उपयोग कैसे करें ताकि कोई भी न रहे:
library (dplyr)
#create new data frame that removes duplicates so none are left
new_df <- df %>%
group_by(across(everything())) %>%
filter(n() == 1 )
#view new data frame
new_df
# A tibble: 4 x 2
# Groups: team, points [4]
team points
1 to 28
2 to 14
3 B 18
4 B 27
ध्यान दें कि प्रत्येक डुप्लिकेट पंक्ति को डेटा फ़्रेम से हटा दिया गया है और कोई भी डुप्लिकेट बरकरार नहीं रखा गया है।
यह भी ध्यान दें कि यह पिछली विधि के समान ही परिणाम देता है।
नोट : अत्यधिक बड़े डेटा फ़्रेम के लिए, dplyr विधि बेस R विधि से तेज़ होगी।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:
शर्त के आधार पर R में पंक्तियाँ कैसे हटाएँ
R में किसी विशिष्ट कॉलम में NA वाली पंक्तियों को कैसे हटाएं