आर में डुप्लिकेट की गणना कैसे करें: उदाहरण के साथ


आप R में डेटा फ़्रेम में डुप्लिकेट की गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:

विधि 1: एक कॉलम में डुप्लिकेट मानों की गणना करें

 sum(duplicated(df$my_column))

विधि 2: डुप्लिकेट पंक्तियों की गणना करें

 nrow(df[duplicated(df), ])

विधि 3: प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की गणना करें

 library (dplyr)

df %>% group_by_all() %>% count

निम्नलिखित उदाहरण दिखाते हैं कि आर में निम्नलिखित डेटा फ्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:

 #create data frame
df = data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                position=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'),
                points=c(5, 5, 8, 10, 5, 7, 10, 10))

#view data frame
df

  team position points
1 GA 5
2 AG 5
3 AG 8
4 AF 10
5 BG 5
6 BG 7
7 BF 10
8 BF 10

उदाहरण 1: एक कॉलम में डुप्लिकेट मानों की गणना करें

निम्नलिखित कोड दिखाता है कि अंक कॉलम में डुप्लिकेट मानों की संख्या की गणना कैसे करें:

 #count number of duplicate values in points column
sum(duplicated(df$points))

[1] 4

हम देख सकते हैं कि पॉइंट कॉलम में 4 डुप्लिकेट मान हैं।

उदाहरण 2: डुप्लिकेट पंक्तियों की गणना करें

निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम में डुप्लिकेट पंक्तियों की संख्या कैसे गिनें:

 #count number of duplicate rows
nrow(df[duplicated(df), ])

[1] 2

हम देख सकते हैं कि डेटा फ़्रेम में 2 डुप्लिकेट पंक्तियाँ हैं।

हम इन 2 डुप्लिकेट पंक्तियों को प्रदर्शित करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #display duplicated rows
df[duplicated(df), ]

  team position points
2 AG 5
8 BF 10

उदाहरण 3: प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की गणना करें

निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम में प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की संख्या की गणना कैसे करें:

 library (dplyr)

#count number of duplicate rows in data frame
df %>% group_by_all() %>% count

# A tibble: 6 x 4
# Groups: team, position, points [6]
  team position points n
         
1 AF 10 1
2 AG 5 2
3 GA 8 1
4 BF 10 2
5 BG 5 1
6 BG 7 1

कॉलम n प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की संख्या प्रदर्शित करता है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

Dplyr का उपयोग करके डुप्लिकेट तत्वों को कैसे खोजें
आर में डुप्लिकेट लाइनें कैसे हटाएं
आर में डुप्लिकेट लाइनें कैसे हटाएं ताकि कोई भी न बचे

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *