आर में समय के अनुसार डेटा को कैसे समूहित करें (उदाहरण के साथ)


आप समय के अनुसार डेटा को समूहीकृत करने और आर में एकत्रीकरण करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 library (dplyr)
library (lubridate)

#group by hours in time column and calculate sum of sales
df %>%
  group_by(time=floor_date(time, ' 1 hour ')) %>%
  summarize(sum_sales=sum(sales))

यह विशेष उदाहरण घंटे के हिसाब से मूल्यों को घंटा नामक कॉलम में समूहित करता है और फिर प्रत्येक घंटे के लिए बिक्री कॉलम में मूल्यों के योग की गणना करता है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: आर में समय के अनुसार समूह डेटा

मान लीजिए कि हमारे पास निम्नलिखित डेटा फ़्रेम है जो किसी स्टोर के लिए दिन के अलग-अलग समय पर की गई बिक्री की संख्या दिखाता है:

 #create data frame
df <- data. frame (time=as. POSIXct (c('2022-01-01 01:14:00', '2022-01-01 01:24:15',
                                 '2022-01-01 02:52:19', '2022-01-01 02:54:00',
                                 '2022-01-01 04:05:10', '2022-01-01 05:35:09')),
                 sales=c(18, 20, 15, 14, 10, 9))

#view data frame
df

                 time sales
1 2022-01-01 01:14:00 18
2 2022-01-01 01:24:15 20
3 2022-01-01 02:52:19 15
4 2022-01-01 02:54:00 14
5 2022-01-01 04:05:10 10
6 2022-01-01 05:35:09 9

हम समय कॉलम को घंटों के आधार पर समूहीकृत करने और प्रत्येक घंटे के लिए बिक्री के योग की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 library (dplyr)
library (lubridate)

#group by hours in time column and calculate sum of sales
df %>%
  group_by(time=floor_date(time, ' 1 hour ')) %>%
  summarize(sum_sales=sum(sales))

`summarise()` ungrouping output (override with `.groups` argument)
# A tibble: 4 x 2
  time sum_sales
                    
1 2022-01-01 01:00:00 38
2 2022-01-01 02:00:00 29
3 2022-01-01 04:00:00 10
4 2022-01-01 05:00:00 9

परिणाम से हम देख सकते हैं:

  • पहले घंटे में कुल 38 बिक्री हुईं।
  • दूसरे घंटे में कुल 29 बिक्री हुईं।
  • चौथे घंटे में कुल 10 बिक्री हुईं।
  • पांचवें घंटे के दौरान कुल 9 बिक्री हुईं।

ध्यान दें कि हम अन्य एकत्रीकरण भी कर सकते हैं।

उदाहरण के लिए, हम प्रति घंटे बिक्री की औसत संख्या की गणना कर सकते हैं:

 library (dplyr)
library (lubridate)

#group by hours in time column and calculate mean of sales
df %>%
  group_by(time=floor_date(time, ' 1 hour ')) %>%
  summarize(mean_sales=mean(sales))

`summarise()` ungrouping output (override with `.groups` argument)
# A tibble: 4 x 2
  time mean_sales
                     
1 2022-01-01 01:00:00 19  
2 2022-01-01 02:00:00 14.5
3 2022-01-01 04:00:00 10  
4 2022-01-01 05:00:00 9

परिणाम से हम देख सकते हैं:

  • पहले घंटे में हुई औसत बिक्री 19 थी।
  • दूसरे घंटे में हुई औसत बिक्री 14.5 थी।
  • चौथे घंटे में हुई औसत बिक्री 10 थी।
  • पांचवें घंटे में हुई औसत बिक्री 9 थी।

बेझिझक अपने स्वयं के डेटा फ़्रेम को समय के अनुसार समूहित करें और सारांश() फ़ंक्शन में मीट्रिक को संशोधित करके किसी भी विशिष्ट मीट्रिक की गणना करें।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ऑपरेशन कैसे करें:

आर में महीने के हिसाब से डेटा को कैसे समूहित करें
आर में सप्ताह के अनुसार डेटा को कैसे समूहित करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *