R में त्वरित रूप से pivottables कैसे बनाएं


एक्सेल में, पिवट टेबल डेटा को समूहीकृत करने और सारांशित करने का एक आसान तरीका प्रदान करते हैं।

उदाहरण के लिए, यदि हमारे पास एक्सेल में निम्नलिखित डेटा सेट है, तो हम क्षेत्र के अनुसार कुल बिक्री को शीघ्रता से सारांशित करने के लिए एक पिवट तालिका का उपयोग कर सकते हैं:

यह हमें बताता है:

  • क्षेत्र ए में कुल 51 बिक्री हुई
  • क्षेत्र बी में कुल बिक्री 85 थी
  • क्षेत्र सी ने कुल 140 बिक्री हासिल की

या हम किसी अन्य मीट्रिक जैसे क्षेत्र के अनुसार औसत बिक्री का सारांश दे सकते हैं:

यह पता चला है कि हम dplyr पैकेज से ग्रुप_बी() और सारांश() फ़ंक्शंस का उपयोग करके आर में समान पिवट टेबल बना सकते हैं।

यह ट्यूटोरियल यह कैसे करें इसके कई उदाहरण प्रदान करता है।

उदाहरण: R में PivotTables बनाएँ

सबसे पहले, आइए R में वही डेटासेट बनाएं जिसका उपयोग हमने Excel के पिछले उदाहरणों में किया था:

 #create data frame
df <- data. frame (region=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C'),
                 device=c('X', 'X', 'Y', 'X', 'Y', 'Y', 'X', 'X', 'Y', 'Y'),
                 sales=c(12, 18, 21, 22, 34, 29, 38, 36, 34, 32))

#view data frame
df

   region device sales
1AX 12
2AX18
3 AY 21
4 BX22
5 BY 34
6 BY 29
7 CX 38
8CX36
9 CY 34
10 CY 32

इसके बाद, आइए dplyr पैकेज को लोड करें और क्षेत्र के आधार पर समूह बनाने के लिए ग्रुप_बाय() और सारांश() फ़ंक्शन का उपयोग करें और क्षेत्र के अनुसार बिक्री का योग ज्ञात करें:

 library (dplyr)

#find sum of sales by region
df %>%
  group_by (region) %>% 
  summarize (sum_sales = sum (sales))

# A tibble: 3 x 2
  region sum_sales
        
1 to 51
2 B 85
3 C 140

हम देख सकते हैं कि ये संख्याएँ एक्सेल परिचयात्मक उदाहरण में दिखाई गई संख्याओं से मेल खाती हैं।

हम क्षेत्र के अनुसार औसत बिक्री की गणना भी कर सकते हैं:

 #find average sales by region
df %>%
  group_by (region) %>% 
  summarize (mean_sales = mean (sales))

# A tibble: 3 x 2
  region mean_sales
        
1 to 17  
2 B 28.3
3 C 35

फिर, ये संख्याएँ पिछले एक्सेल उदाहरण में दिखाई गई संख्याओं से मेल खाती हैं।

ध्यान दें कि हम अनेक चरों के आधार पर भी समूह बना सकते हैं। उदाहरण के लिए, हम क्षेत्र और डिवाइस प्रकार के आधार पर समूहीकृत बिक्री का योग पा सकते हैं:

 #find sum of sales by region and device type
df %>%
  group_by (region, device) %>% 
  summarize (sum_sales = sum (sales))

# A tibble: 6 x 3
# Groups: region [3]
  region device sum_sales
          
1AX30
2 AY 21
3 BX22
4 BY 63
5 CX 74
6 CY 66

अतिरिक्त संसाधन

R में VLOOKUP (एक्सेल के समान) कैसे करें
संपूर्ण गाइड: आर में डेटा को समूहीकृत और सारांशित कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *