R ဖြင့် အချိန်အလိုက် data အုပ်စုဖွဲ့နည်း (ဥပမာဖြင့်)


ဒေတာများကို အချိန်အလိုက် အုပ်စုဖွဲ့ရန်နှင့် R ဖြင့် ပေါင်းစည်းရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-

 library (dplyr)
library (lubridate)

#group by hours in time column and calculate sum of sales
df %>%
  group_by(time=floor_date(time, ' 1 hour ')) %>%
  summarize(sum_sales=sum(sales))

ဤဥပမာသည် တန်ဖိုးများကို နာရီအလိုက် Hour ဟုခေါ်သော ကော်လံတစ်ခုအဖြစ် အုပ်စုဖွဲ့ပြီး နာရီတစ်ခုစီအတွက် အရောင်း ကော်လံရှိ တန်ဖိုးများ၏ပေါင်းလဒ်များကို တွက်ချက်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- R တွင် အချိန်အလိုက် အုပ်စုဒေတာ

စတိုးဆိုင်တစ်ခုအတွက် တစ်နေ့တာ၏ မတူညီသောအချိန်များတွင် ရောင်းချမှုအရေအတွက်ကို ပြသသည့် အောက်ပါဒေတာဘောင်တစ်ခုရှိသည် ဆိုကြပါစို့။

 #create data frame
df <- data. frame (time=as. POSIXct (c('2022-01-01 01:14:00', '2022-01-01 01:24:15',
                                 '2022-01-01 02:52:19', '2022-01-01 02:54:00',
                                 '2022-01-01 04:05:10', '2022-01-01 05:35:09')),
                 sales=c(18, 20, 15, 14, 10, 9))

#view data frame
df

                 time sales
1 2022-01-01 01:14:00 18
2 2022-01-01 01:24:15 20
3 2022-01-01 02:52:19 15
4 2022-01-01 02:54:00 14
5 2022-01-01 04:05:10 10
6 2022-01-01 05:35:09 9

အချိန် ကော်လံကို နာရီအလိုက် အုပ်စုဖွဲ့ပြီး နာရီတစ်ခုစီအတွက် အရောင်း ပေါင်းကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 library (dplyr)
library (lubridate)

#group by hours in time column and calculate sum of sales
df %>%
  group_by(time=floor_date(time, ' 1 hour ')) %>%
  summarize(sum_sales=sum(sales))

`summarise()` ungrouping output (override with `.groups` argument)
# A tibble: 4 x 2
  time sum_sales
                    
1 2022-01-01 01:00:00 38
2 2022-01-01 02:00:00 29
3 2022-01-01 04:00:00 10
4 2022-01-01 05:00:00 9

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • ပထမတစ်နာရီအတွင်း စုစုပေါင်းရောင်းချမှု ၃၈ ခု ပြုလုပ်ခဲ့သည်။
  • ဒုတိယနာရီအတွင်း စုစုပေါင်း ၂၉ စီး ရောင်းချနိုင်ခဲ့သည်။
  • စတုတ္ထနာရီတွင် စုစုပေါင်း အရောင်း ၁၀ မှု ပြုလုပ်ခဲ့သည်။
  • ပဉ္စမနာရီအတွင်း စုစုပေါင်း အရောင်း မှု ပြုလုပ်ခဲ့သည်။

ကျွန်ုပ်တို့သည် အခြားသော စုစည်းမှုကိုလည်း လုပ်ဆောင်နိုင်သည်ကို သတိပြုပါ။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် တစ်နာရီလျှင် ပျမ်းမျှ ရောင်းအားကို တွက်ချက်နိုင်သည်-

 library (dplyr)
library (lubridate)

#group by hours in time column and calculate mean of sales
df %>%
  group_by(time=floor_date(time, ' 1 hour ')) %>%
  summarize(mean_sales=mean(sales))

`summarise()` ungrouping output (override with `.groups` argument)
# A tibble: 4 x 2
  time mean_sales
                     
1 2022-01-01 01:00:00 19  
2 2022-01-01 02:00:00 14.5
3 2022-01-01 04:00:00 10  
4 2022-01-01 05:00:00 9

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • ပထမတစ်နာရီအတွင်း ပျမ်းမျှရောင်းအားမှာ ၁၉
  • ဒုတိယနာရီတွင် ပျမ်းမျှရောင်းအားမှာ 14.5 ဖြစ်သည်။
  • စတုတ္ထနာရီတွင် ပျမ်းမျှရောင်းအားမှာ 10 ဖြစ်သည်။
  • ပဉ္စမနာရီတွင် ပျမ်းမျှရောင်းအားမှာ

သင်၏ကိုယ်ပိုင်ဒေတာဘောင်ကို အချိန်အလိုက် အုပ်စုဖွဲ့ပြီး summary() လုပ်ဆောင်ချက်ရှိ မက်ထရစ်ကို မွမ်းမံခြင်းဖြင့် သင်အလိုရှိသော မည်သည့်တိကျသောမက်ထရစ်ကိုမဆို တွက်ချက်ပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R ဖြင့် လအလိုက် ဒေတာအုပ်စုဖွဲ့နည်း
R ဖြင့် အပတ်တိုင်း ဒေတာအုပ်စုဖွဲ့နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်