R में त्वरित रूप से pivottables कैसे बनाएं
एक्सेल में, पिवट टेबल डेटा को समूहीकृत करने और सारांशित करने का एक आसान तरीका प्रदान करते हैं।
उदाहरण के लिए, यदि हमारे पास एक्सेल में निम्नलिखित डेटा सेट है, तो हम क्षेत्र के अनुसार कुल बिक्री को शीघ्रता से सारांशित करने के लिए एक पिवट तालिका का उपयोग कर सकते हैं:
यह हमें बताता है:
- क्षेत्र ए में कुल 51 बिक्री हुई
- क्षेत्र बी में कुल बिक्री 85 थी
- क्षेत्र सी ने कुल 140 बिक्री हासिल की
या हम किसी अन्य मीट्रिक जैसे क्षेत्र के अनुसार औसत बिक्री का सारांश दे सकते हैं:
यह पता चला है कि हम dplyr पैकेज से ग्रुप_बी() और सारांश() फ़ंक्शंस का उपयोग करके आर में समान पिवट टेबल बना सकते हैं।
यह ट्यूटोरियल यह कैसे करें इसके कई उदाहरण प्रदान करता है।
उदाहरण: R में PivotTables बनाएँ
सबसे पहले, आइए R में वही डेटासेट बनाएं जिसका उपयोग हमने Excel के पिछले उदाहरणों में किया था:
#create data frame df <- data. frame (region=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C'), device=c('X', 'X', 'Y', 'X', 'Y', 'Y', 'X', 'X', 'Y', 'Y'), sales=c(12, 18, 21, 22, 34, 29, 38, 36, 34, 32)) #view data frame df region device sales 1AX 12 2AX18 3 AY 21 4 BX22 5 BY 34 6 BY 29 7 CX 38 8CX36 9 CY 34 10 CY 32
इसके बाद, आइए dplyr पैकेज को लोड करें और क्षेत्र के आधार पर समूह बनाने के लिए ग्रुप_बाय() और सारांश() फ़ंक्शन का उपयोग करें और क्षेत्र के अनुसार बिक्री का योग ज्ञात करें:
library (dplyr) #find sum of sales by region df %>% group_by (region) %>% summarize (sum_sales = sum (sales)) # A tibble: 3 x 2 region sum_sales 1 to 51 2 B 85 3 C 140
हम देख सकते हैं कि ये संख्याएँ एक्सेल परिचयात्मक उदाहरण में दिखाई गई संख्याओं से मेल खाती हैं।
हम क्षेत्र के अनुसार औसत बिक्री की गणना भी कर सकते हैं:
#find average sales by region df %>% group_by (region) %>% summarize (mean_sales = mean (sales)) # A tibble: 3 x 2 region mean_sales 1 to 17 2 B 28.3 3 C 35
फिर, ये संख्याएँ पिछले एक्सेल उदाहरण में दिखाई गई संख्याओं से मेल खाती हैं।
ध्यान दें कि हम अनेक चरों के आधार पर भी समूह बना सकते हैं। उदाहरण के लिए, हम क्षेत्र और डिवाइस प्रकार के आधार पर समूहीकृत बिक्री का योग पा सकते हैं:
#find sum of sales by region and device type df %>% group_by (region, device) %>% summarize (sum_sales = sum (sales)) # A tibble: 6 x 3 # Groups: region [3] region device sum_sales 1AX30 2 AY 21 3 BX22 4 BY 63 5 CX 74 6 CY 66
अतिरिक्त संसाधन
R में VLOOKUP (एक्सेल के समान) कैसे करें
संपूर्ण गाइड: आर में डेटा को समूहीकृत और सारांशित कैसे करें