Dplyr का उपयोग करके विशिष्ट मानों की गणना कैसे करें (उदाहरण के साथ)


आप dplyr के n_distinct() फ़ंक्शन का उपयोग करके R डेटा फ़्रेम में विशिष्ट मानों की संख्या की गणना करने के लिए निम्न में से किसी भी विधि का उपयोग कर सकते हैं:

विधि 1: एक कॉलम में अलग-अलग मानों की गणना करें

 n_distinct(df$column_name)

विधि 2: सभी स्तंभों में अलग-अलग मानों की गणना करें

 sapply(df, function (x) n_distinct(x))

विधि 3: समूह द्वारा भिन्न मानों की गणना करें

 df %>%
group_by (grouping_column) %>%
summarize (count_distinct = n_distinct(values_column))

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित डेटा फ़्रेम के साथ व्यवहार में इनमें से प्रत्येक विधि का उपयोग कैसे करें:

 library (dplyr)

#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(6, 6, 8, 10, 9, 9, 12, 12),
                 assists=c(3, 6, 4, 2, 4, 5, 5, 9))

#view data frame
df

  team points assists
1 to 6 3
2 to 6 6
3 to 8 4
4 to 10 2
5 B 9 4
6 B 9 5
7 B 12 5
8 B 12 9

विधि 1: एक कॉलम में अलग-अलग मानों की गणना करें

निम्नलिखित कोड दिखाता है कि ‘टीम’ कॉलम में अलग-अलग मानों की संख्या की गणना करने के लिए n_distinct() का उपयोग कैसे करें:

 #count distinct values in 'team' column
n_distinct(df$team)

[1] 2

‘टीम’ कॉलम में 2 अलग-अलग मान हैं।

विधि 2: सभी स्तंभों में अलग-अलग मानों की गणना करें

निम्नलिखित कोड दिखाता है कि डेटा फ्रेम के प्रत्येक कॉलम में अलग-अलग मानों की संख्या की गणना करने के लिए sapply() और n_distinct() फ़ंक्शन का उपयोग कैसे करें:

 #count distinct values in every column
sapply(df, function (x) n_distinct(x))

   team points assists 
      2 5 6

परिणाम से हम देख सकते हैं:

  • ‘टीम’ कॉलम में 2 अलग-अलग मान हैं
  • “अंक” कॉलम में 5 अलग-अलग मान हैं
  • “मदद” कॉलम में 6 अलग-अलग मान हैं

विधि 3: समूह द्वारा भिन्न मानों की गणना करें

निम्नलिखित कोड दिखाता है कि प्रति समूह अलग-अलग मानों की संख्या की गणना करने के लिए n_distinct() फ़ंक्शन का उपयोग कैसे करें:

 #count distinct 'points' values by 'team'
df %>%
  group_by (team) %>%
  summarize (distinct_points = n_distinct(points))

# A tibble: 2 x 2
  team distinct_points 
1 to 3
2 B 2

परिणाम से हम देख सकते हैं:

  • टीम ए के लिए 3 अलग-अलग बिंदु मान हैं।
  • टीम बी के लिए 2 अलग-अलग पॉइंट मान हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि dplyr का उपयोग करके अन्य सामान्य ऑपरेशन कैसे करें:

Dplyr का उपयोग करके मानों को कैसे रिकोड करें
dplyr में NA को शून्य से कैसे बदलें
Dplyr का उपयोग करके समूह द्वारा चरों को कैसे क्रमबद्ध करें
dplyr का उपयोग करके समूह द्वारा पहली पंक्ति का चयन कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *