आर में प्रति समूह अवलोकनों की गणना कैसे करें


अक्सर आपको आर में प्रति समूह अवलोकनों की संख्या गिनने में रुचि हो सकती है।

सौभाग्य से, dplyr लाइब्रेरी के count() फ़ंक्शन का उपयोग करके ऐसा करना आसान है।

यह ट्यूटोरियल निम्नलिखित डेटा फ़्रेम का उपयोग करके इस फ़ंक्शन के व्यावहारिक उपयोग के कई उदाहरण बताता है:

 #create data frame
df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'CC'),
                 position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '),
                 points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#view data frame
df

   team position points
1 GA 4
2 AG 13
3AF 7
4 BG 8
5 BF 15
6 BF 15
7 BF 17
8 BG 9
9 GC 21
10 CF 22
11 CF 25
12 CF 31

उदाहरण 1: एक चर द्वारा गिनती

निम्नलिखित कोड दिखाता है कि प्रति टीम खिलाड़ियों की कुल संख्या की गणना कैसे करें:

 library (dplyr)

#count total observations by variable 'team'
df %>% count(team)

# A tibble: 3 x 2
  team n
   
1 to 3
2 B 5
3 C 4

परिणाम से हम देख सकते हैं कि:

  • टीम ए 3 खिलाड़ियों से बनी है
  • टीम बी 5 खिलाड़ियों से बनी है
  • टीम C 4 खिलाड़ियों से बनी है

यह एकल गिनती() फ़ंक्शन हमें प्रति टीम खिलाड़ियों के वितरण का एक अच्छा विचार देता है।

ध्यान दें कि यदि हम चाहें तो हम गिनती को क्रमबद्ध भी कर सकते हैं:

 #count total observations by variable 'team'
df %>% count(team, sort= TRUE )

# A tibble: 3 x 2
  team n
   
1 B 5
2 C 4
3 to 3

उदाहरण 2: कई चरों द्वारा गिनती

हम कई चरों के आधार पर भी क्रमबद्ध कर सकते हैं:

 #count total observations by 'team' and 'position'
df %>% count(team, position)

# A tibble: 6 x 3
  team position n
       
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 GC 1

परिणाम से हम देख सकते हैं कि:

  • टीम ए में 1 खिलाड़ी “एफ” (फॉरवर्ड) स्थिति में और 2 खिलाड़ी “जी” (गार्ड) स्थिति में हैं।
  • टीम बी में 3 खिलाड़ी “एफ” (फॉरवर्ड) स्थिति में और 2 खिलाड़ी “जी” (गार्ड) स्थिति में हैं।
  • टीम सी में 3 खिलाड़ी “एफ” (फॉरवर्ड) स्थिति में और 1 खिलाड़ी “जी” (गार्ड) स्थिति में है।

उदाहरण 3: भारित संख्या

हम एक वेरिएबल की गिनती को दूसरे वेरिएबल द्वारा “वेट” भी कर सकते हैं। उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि वजन के रूप में “अंक” चर का उपयोग करके, प्रति टीम कुल टिप्पणियों की गणना कैसे की जाए:

 df %>% count(team, wt= points )

# A tibble: 3 x 2
  team n
   
1 to 24
2 B 64
3 C 99

आप यहां काउंट() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ पा सकते हैं।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *