Category: လမ်းညွှန်
စာရင်းအင်းများတွင်၊ သက်ဆိုင်သောလူဦးရေ၏နည်းလမ်းများကြားတွင် စာရင်းအင်းအရသိသာထင်ရှားသောခြားနားချက်ရှိမရှိဆုံးဖြတ်ရန် တစ်လမ်းသွား ANOVA ကို အသုံးပြုသည်။ သင်တစ်လမ်းသွား ANOVA ကိုလုပ်ဆောင်သည့်အခါတိုင်း၊ သင်သည် စတုရန်းတန်ဖိုးသုံးခု၏ပေါင်းလဒ်များကို အမြဲတမ်းတွက်ချက်လိမ့်မည်- 1. စတုရန်းများ ဆုတ်ယုတ်မှု (SSR) ၎င်းသည် အုပ်စုတစ်ခုစီ၏ ပျမ်းမျှနှင့် ယေဘူယျပျမ်းမျှ အကြား ကွာခြားချက်များ၏ နှစ်ထပ်ကိန်းများဖြစ်သည်။ 2. Sum of Squares Error (SSE) ဤသည်မှာ ရှုမြင်မှုတစ်ခုစီနှင့် ယင်းလေ့လာချက်၏ အုပ်စုပျမ်းမျှအကြား ကွာခြားချက်များ၏ နှစ်ထပ်ကိန်းများဖြစ်သည်။ 3. စုစုပေါင်းစတုရန်းများ (SST) ဤသည်မှာ လူတစ်ဦးစီ၏...
စာရင်းဇယားများတွင်၊ ကျွန်ုပ်တို့သည် အုပ်စုနှစ်ခု၏ ဆိုလိုရင်းတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ရှိမရှိကို ဆုံးဖြတ်ရန် p-values များကို အသုံးပြုလေ့ရှိပါသည်။ သို့သော်လည်း၊ အုပ်စုနှစ်ခုကြားတွင် ကိန်းဂဏန်းအချက်အလတ် သိသိသာသာကွာခြားမှု ရှိ/မရှိကို p-value က ကျွန်ုပ်တို့ကို ပြောပြနိုင်သော်လည်း အကျိုးသက်ရောက်မှုအရွယ်အစားက ထိုကွာခြားချက်မှာ အမှန်တကယ် မည်မျှကြီးမားသည်ကို ပြောပြနိုင်ပါသည်။ အကျိုးသက်ရောက်မှုအရွယ်အစား၏ အသုံးအများဆုံးတိုင်းတာမှုတစ်ခုမှာ Cohen’s d ဖြစ်ပြီး၊ အောက်ပါအတိုင်းတွက်ချက်သည်။ Cohen’s D = ( x1 – x2 ) / √...
လအလိုက်ဒေတာများကို လျင်မြန်စွာအုပ်စုဖွဲ့ရန် R ရှိ lubricadate package မှ floor_date() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်- library (tidyverse) df %>% group_by(month = lubridate::floor_date(date_column, ' month ')) %>% summarize(sum = sum(value_column)) အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။ ဥပမာ- R ဖြင့် လအလိုက် အုပ်စုဒေတာ ကျွန်ုပ်တို့တွင် မတူညီသောရက်စွဲများမှ ပစ္စည်းတစ်ခု၏စုစုပေါင်းရောင်းချမှုကိုပြသသော...
R တွင် သင်ကြုံတွေ့နိုင်သော အမှားတစ်ခုမှာ- Error: ggplot2 doesn't know how to deal with data of class uneval ဒေတာဘောင်နှစ်ခုကို တစ်ပြိုင်နက်တည်းဆွဲရန် ggplot2 ကို အသုံးပြုရန်ကြိုးစားသော်လည်း၊ geom_line() လုပ်ဆောင်ချက်တွင် ဒေတာ အငြင်းအခုံကို အသုံးမပြုနိုင်သည့်အခါတွင် ဤအမှားအယွင်းဖြစ်တတ်သည်။ ဤသင်ခန်းစာတွင် ဤအမှားကို မည်သို့ပြင်ရမည်ကို တိတိကျကျ ရှင်းပြထားသည်။ အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။ ကျွန်ုပ်တို့တွင် သတ်မှတ်ထားသောအချိန်များနှင့် မတူညီသောနေ့ရက်များတွင် ရောင်းချမှုအရေအတွက်ကိုပြသသည့် R တွင် ဒေတာဘောင်နှစ်ခုရှိသည်ဆိုကြပါစို့။...
R တွင် ပျမ်းမျှတန်ဖိုးဖြင့် အကွက်ကွက်ကွက်တစ်ခုဆွဲရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- Base R ကိုသုံးပါ။ #create boxplots boxplot(df$values~df$group) #calculate mean value by group means <- tapply(df$values, df$group, mean) #add means as circles to each boxplot points(means, pch= 20 ) နည်းလမ်း 2- ggplot2 ကိုသုံးပါ။ library (ggplot2)...
အဆိုပါ ဖြစ်ရပ် B ဖြစ်ပေါ်လာခြင်းကြောင့် ဖြစ်ရပ် A ၏ အခြေအနေအရ ဖြစ်နိုင်ခြေ ကို အောက်ပါအတိုင်း တွက်ချက်သည်- P(A|B) = P(A∩B) / P(B) ရွှေ- P(A∩B) = ဖြစ်ရပ် A နှင့် ဖြစ်ရပ် B နှစ်ခုစလုံး ဖြစ်ပွားနိုင်ခြေ။ P(B) = အဆိုပါဖြစ်ရပ် B ဖြစ်ပေါ်လာနိုင်ခြေ။ ရာသီဥတုခန့်မှန်းချက်၊ အားကစားလောင်းကစား၊ အရောင်းခန့်မှန်းချက်နှင့် အခြားအရာများ အပါအဝင် လက်တွေ့ဘဝနယ်ပယ် အမျိုးအစားအားလုံးတွင် အခြေအနေအရ ဖြစ်နိုင်ခြေကို...
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ အဆင့်လိုက်ရွေးချယ်ခြင်း သည် ကိန်းဂဏန်းစာရင်းဝင်ရန် ခိုင်လုံသောအကြောင်းပြချက်မရှိတော့မချင်း ကြိုတင်ခန့်မှန်းသူအား ကိန်းရှင်အစုတစ်ခုမှ ဆုတ်ယုတ်မှုပုံစံ တစ်ခုတည်ဆောက်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် လုပ်ငန်းစဉ်တစ်ခုဖြစ်သည်။ သို့မဟုတ် နောက်ထပ်ဖျက်ပါ။ အဆင့်ဆင့်ရွေးချယ်ခြင်း၏ ပန်းတိုင်မှာ တုံ့ပြန်မှုကိန်းရှင် နှင့် ကိန်းဂဏန်းအရ သိသာထင်ရှားစွာဆက်စပ်နေသည့် ကြိုတင်ခန့်မှန်းကိန်းရှင်အားလုံးပါဝင်သည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို ဖန်တီးရန်ဖြစ်သည်။ အသုံးအများဆုံး အဆင့်ဆင့်ရွေးချယ်ရေးနည်းလမ်းများထဲမှ တစ်ခုကို တိုက်ရိုက်ရွေးချယ်ခြင်း ဟု လူသိများပြီး အောက်ပါအတိုင်း လုပ်ဆောင်နိုင်သည်- အဆင့် 1- ကြိုတင်ခန့်မှန်းနိုင်သော ကိန်းရှင်များမပါဘဲ ကြားဖြတ်-သီးသန့် ဆုတ်ယုတ်မှုပုံစံကို ဖြည့်ပါ။ မော်ဒယ်အတွက် AIC * တန်ဖိုးကို...
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ အဆင့်လိုက်ရွေးချယ်ခြင်း သည် ကိန်းဂဏန်းစာရင်းဝင်ရန် ခိုင်လုံသောအကြောင်းပြချက်မရှိတော့မချင်း ကြိုတင်ခန့်မှန်းသူအား ကိန်းရှင်အစုတစ်ခုမှ ဆုတ်ယုတ်မှုပုံစံ တစ်ခုတည်ဆောက်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် လုပ်ငန်းစဉ်တစ်ခုဖြစ်သည်။ သို့မဟုတ် နောက်ထပ်ဖျက်ပါ။ အဆင့်ဆင့်ရွေးချယ်ခြင်း၏ ပန်းတိုင်မှာ တုံ့ပြန်မှုကိန်းရှင် နှင့် ကိန်းဂဏန်းအရ သိသာထင်ရှားစွာဆက်စပ်နေသည့် ကြိုတင်ခန့်မှန်းကိန်းရှင်အားလုံးပါဝင်သည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို ဖန်တီးရန်ဖြစ်သည်။ အသုံးများဆုံး အဆင့်ဆင့်ရွေးချယ်ရေးနည်းလမ်းများထဲမှ တစ်ခုကို backward selection ဟုခေါ်သည် ၊ အောက်ပါအတိုင်း အလုပ်လုပ်သည် ။ အဆင့် 1- p ကြိုတင်ခန့်မှန်းကိန်းရှင်အားလုံးကို အသုံးပြု၍ ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို ကွက်တိပါ။ မော်ဒယ်အတွက် AIC...
စာရင်းဇယားများတွင်၊ လူဦးရေအချိုးအစား သို့မဟုတ် လူဦးရေဆိုလိုရင်း၏ တိကျမှုကို အကဲဖြတ်ရန် အမှား၏အနားသတ်ကို အသုံးပြုသည်။ လူဦးရေကန့်သတ်ချက်များ အတွက် ယုံကြည်စိတ်ချမှုကြားကာလများကို တွက်ချက်ရာတွင် ယေဘူယျအားဖြင့် ကျွန်ုပ်တို့သည် အမှားအယွင်းတစ်ခုကို အသုံးပြုပါသည်။ အောက်ဖော်ပြပါ ဥပမာများသည် လူဦးရေအချိုးအစားနှင့် လူဦးရေဆိုလိုအားအတွက် အမှား၏အနားသတ်ကို တွက်ချက်ပြီး အဓိပ္ပာယ်ပြန်ဆိုနည်းကို ပြသထားသည်။ ဥပမာ 1- လူဦးရေအချိုးအတွက် အမှား၏အနားသတ်ကို ဘာသာပြန်ခြင်း။ လူဦးရေအချိုးအစားအတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်- ယုံကြည်မှုကြားကာလ = p +/- z*(√ p(1-p) /...
အီတလီ စာရင်းအင်းပညာရှင် Corrado Gini ကို အစွဲပြု၍ အမည်ပေးထားသည့် Gini coefficient သည် လူဦးရေ၏ ဝင်ငွေခွဲဝေမှုကို တိုင်းတာသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ Gini coefficient ၏တန်ဖိုးသည် 0 မှ 1 အထိရှိပါသည်၊ မြင့်မားသောတန်ဖိုးများသည် ပိုကြီးသောဝင်ငွေမညီမျှမှုကို ကိုယ်စားပြုပြီး ၎င်းနေရာတွင်- ၀င် ငွေ တန်းတူညီမျှမှုကို ကိုယ်စားပြုသည် (လူတိုင်းတွင် တူညီသော ၀င်ငွေရှိသည်) 1 သည် ပြီးပြည့်စုံသော ၀င်ငွေမညီမျှမှုကို ကိုယ်စားပြုသည် (တစ်ဦးချင်းစီတွင် ဝင်ငွေအားလုံးရှိသည်) နိုင်ငံအလိုက် Gini...