आर में समय के अनुसार डेटा को कैसे समूहित करें (उदाहरण के साथ)
आप समय के अनुसार डेटा को समूहीकृत करने और आर में एकत्रीकरण करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
library (dplyr) library (lubridate) #group by hours in time column and calculate sum of sales df %>% group_by(time=floor_date(time, ' 1 hour ')) %>% summarize(sum_sales=sum(sales))
यह विशेष उदाहरण घंटे के हिसाब से मूल्यों को घंटा नामक कॉलम में समूहित करता है और फिर प्रत्येक घंटे के लिए बिक्री कॉलम में मूल्यों के योग की गणना करता है।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: आर में समय के अनुसार समूह डेटा
मान लीजिए कि हमारे पास निम्नलिखित डेटा फ़्रेम है जो किसी स्टोर के लिए दिन के अलग-अलग समय पर की गई बिक्री की संख्या दिखाता है:
#create data frame
df <- data. frame (time=as. POSIXct (c('2022-01-01 01:14:00', '2022-01-01 01:24:15',
'2022-01-01 02:52:19', '2022-01-01 02:54:00',
'2022-01-01 04:05:10', '2022-01-01 05:35:09')),
sales=c(18, 20, 15, 14, 10, 9))
#view data frame
df
time sales
1 2022-01-01 01:14:00 18
2 2022-01-01 01:24:15 20
3 2022-01-01 02:52:19 15
4 2022-01-01 02:54:00 14
5 2022-01-01 04:05:10 10
6 2022-01-01 05:35:09 9
हम समय कॉलम को घंटों के आधार पर समूहीकृत करने और प्रत्येक घंटे के लिए बिक्री के योग की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
library (dplyr) library (lubridate) #group by hours in time column and calculate sum of sales df %>% group_by(time=floor_date(time, ' 1 hour ')) %>% summarize(sum_sales=sum(sales)) `summarise()` ungrouping output (override with `.groups` argument) # A tibble: 4 x 2 time sum_sales 1 2022-01-01 01:00:00 38 2 2022-01-01 02:00:00 29 3 2022-01-01 04:00:00 10 4 2022-01-01 05:00:00 9
परिणाम से हम देख सकते हैं:
- पहले घंटे में कुल 38 बिक्री हुईं।
- दूसरे घंटे में कुल 29 बिक्री हुईं।
- चौथे घंटे में कुल 10 बिक्री हुईं।
- पांचवें घंटे के दौरान कुल 9 बिक्री हुईं।
ध्यान दें कि हम अन्य एकत्रीकरण भी कर सकते हैं।
उदाहरण के लिए, हम प्रति घंटे बिक्री की औसत संख्या की गणना कर सकते हैं:
library (dplyr) library (lubridate) #group by hours in time column and calculate mean of sales df %>% group_by(time=floor_date(time, ' 1 hour ')) %>% summarize(mean_sales=mean(sales)) `summarise()` ungrouping output (override with `.groups` argument) # A tibble: 4 x 2 time mean_sales 1 2022-01-01 01:00:00 19 2 2022-01-01 02:00:00 14.5 3 2022-01-01 04:00:00 10 4 2022-01-01 05:00:00 9
परिणाम से हम देख सकते हैं:
- पहले घंटे में हुई औसत बिक्री 19 थी।
- दूसरे घंटे में हुई औसत बिक्री 14.5 थी।
- चौथे घंटे में हुई औसत बिक्री 10 थी।
- पांचवें घंटे में हुई औसत बिक्री 9 थी।
बेझिझक अपने स्वयं के डेटा फ़्रेम को समय के अनुसार समूहित करें और सारांश() फ़ंक्शन में मीट्रिक को संशोधित करके किसी भी विशिष्ट मीट्रिक की गणना करें।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ऑपरेशन कैसे करें:
आर में महीने के हिसाब से डेटा को कैसे समूहित करें
आर में सप्ताह के अनुसार डेटा को कैसे समूहित करें