Category: လမ်းညွှန်

ဒေတာကို ဘယ်လို တွန်းလှန်နိုင်သလဲ- ဥပမာများဖြင့်

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

“ Detrending” time series data ဆိုသည်မှာ ဒေတာရှိ နောက်ခံလမ်းကြောင်းကို ဖယ်ရှားခြင်း ဖြစ်သည်။ ဤအရာကို ကျွန်ုပ်တို့ပြုလုပ်လိုရခြင်း၏ အဓိကအကြောင်းရင်းမှာ ရာသီအလိုက် သို့မဟုတ် စက်ဝန်းဖြစ်သော ဒေတာများတွင် အရင်းခံလမ်းကြောင်းများကို ပိုမိုလွယ်ကူစွာ မြင်ယောင်နိုင်ရန်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ ကုမ္ပဏီတစ်ခု၏ စုစုပေါင်းရောင်းအားကို ကိုယ်စားပြုသည့် အောက်ပါ အချိန်စီးရီးဒေတာကို ထည့်သွင်းစဉ်းစားပါ 20 ကာလဆက်တိုက် ထင်ရှားသည်မှာ အချိန်နှင့်အမျှ အရောင်းများ တိုးလာသော်လည်း အချိန်ကြာလာသည်နှင့်အမျှ သေးငယ်သော “ တောင်တန်းများ” မှ သက်သေပြထားသည့်အတိုင်း ဒေတာထဲတွင် စက်ဝိုင်း...

[ဆက်လက်ဖတ်ရှုရန်...]

Ggplot2 ဖြင့် အုပ်စုလိုက် ဆုတ်ယုတ်မှုမျဉ်းကို ဘယ်လိုဆွဲမလဲ။

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

R visualization package ggplot2 ကိုအသုံးပြု၍ အုပ်စုဆုတ်ယုတ်မှုမျဉ်းကိုဆွဲရန် အောက်ပါအထားအသိုကိုသုံးနိုင်သည်။ ggplot(df, aes (x = x_variable, y = y_variable, color = group_variable)) + geom_point() + geom_smooth(method = " lm ", fill = NA ) ဤသင်ခန်းစာတွင် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့တွင်အသုံးပြုနည်း၏ အတိုကောက် ဥပမာကို ပေးပါသည်။ ဥပမာ- ggplot2 ဖြင့် အုပ်စုအလိုက် ဆုတ်ယုတ်မှုမျဥ်းများကို...

[ဆက်လက်ဖတ်ရှုရန်...]

Durbin-watson စမ်းသပ်မှု- အဓိပ္ပါယ်နှင့် ဥပမာ

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

linear regression ၏ အဓိက ယူဆချက် တစ်ခုမှာ တစ်ဆက်တည်း အကြွင်းအကျန်များကြား ဆက်စပ်မှု မရှိခြင်းပင်ဖြစ်သည်။ တစ်နည်းဆိုရသော် အကြွင်းအကျန်များသည် သီးခြားဖြစ်သည်ဟု ကျွန်ုပ်တို့ယူဆသည်။ ဤယူဆချက်ကို ချိုးဖောက်သောအခါ၊ ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ ဖော်ကိန်းများ၏ စံအမှားများကို လျှော့တွက်နိုင်ဖွယ်ရှိသည်၊ ဆိုလိုသည်မှာ ခန့်မှန်းသူကိန်းရှင်များသည် ၎င်းတို့မဟုတ်သည့်အခါတွင် ကိန်းဂဏန်းအရ သိသာထင်ရှား သည်ဟု ယူဆနိုင်ဖွယ်ရှိသည်။ လက်တွေ့မှာ မဟုတ်ဘူး။ ဤယူဆချက်နှင့် ကိုက်ညီခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်ရန် နည်းလမ်းတစ်ခုမှာ ဆုတ်ယုတ်မှု၏ အကြွင်းအကျန်များတွင် autocorrelation ရှိနေခြင်းကို သိရှိရန် အသုံးပြုသည့်...

[ဆက်လက်ဖတ်ရှုရန်...]

အစုလိုက်ကွဲလွဲမှုဆိုတာ ဘာလဲ။ (အဓိပ္ပါယ် & #038; ဥပမာ)

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

စာရင်းဇယားများတွင်၊ အစုအဝေးကွဲလွဲမှုသည် ပျမ်းမျှအားဖြင့် နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော အစုကွဲကွဲပြားမှုများကို ရည်ညွှန်းသည်။ အုပ်စုများအကြား ဘုံကွဲလွဲမှုများအတွက် နံပါတ်တစ်ခုတည်းကိုရရှိရန် ကျွန်ုပ်တို့သည် အုပ်စုကွဲကွဲပြားမှုများကို နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသောအုပ်စုကွဲကွဲပြားမှုများကို “ ပေါင်းစည်းနေသည်” ကိုဖော်ပြရန် “ စုပေါင်း” ဟူသောစကားလုံးကို ကျွန်ုပ်တို့အသုံးပြုပါသည်။ လက်တွေ့တွင်၊ လူဦးရေနှစ်ခု၏ တူညီခြင်းရှိ၊ မရှိကို ဆုံးဖြတ်ရန် အသုံးပြုသည့် နမူနာနှစ်ခု t-test တွင် အများစုသည် စုပေါင်းကွဲလွဲမှုကို မကြာခဏအသုံးပြုသည်။ နမူနာနှစ်ခုကြားတွင် စုပေါင်းကွဲလွဲမှုကို ယေဘူယျအားဖြင့် sp 2 ကို...

[ဆက်လက်ဖတ်ရှုရန်...]

ဒေတာကို winsorize လုပ်နည်း- အဓိပ္ပါယ်ဖွင့်ဆိုချက်များနှင့် ဥပမာများ

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Winsorizing data ဆိုသည်မှာ ဒေတာ၏ သတ်မှတ်ထားသော ရာခိုင်နှုန်းတစ်ခုနှင့် ညီမျှသော လွန်ကဲသော အစွန်းအထင်းများကို သတ်မှတ်ခြင်း ဖြစ်သည်။ ဥပမာအားဖြင့်၊ 90% winsorization သည် 95th percentile ၏အထက်တွင် မှတ်သားမှုများ အားလုံးကို 95th percentile မှတန်ဖိုးနှင့် ညီမျှပြီး 5th percentile အောက်ရှိ မှတ်သားမှုများအားလုံးကို 5th percentile မှ တန်ဖိုးနှင့်ညီမျှသည်။ အမှန်မှာ၊ winsorizing data ဆိုသည်မှာ data set တစ်ခု၏ လွန်ကဲသောတန်ဖိုးများကို လွန်ကဲသောတန်ဖိုးများအဖြစ်သို့...

[ဆက်လက်ဖတ်ရှုရန်...]

Excel တွင်ဒေတာကိုအနိုင်ရနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Winsorizing data ဆိုသည်မှာ ဒေတာ၏ သတ်မှတ်ထားသော ရာခိုင်နှုန်းတစ်ခုနှင့် ညီမျှသော လွန်ကဲသော အစွန်းအထင်းများကို သတ်မှတ်ခြင်း ဖြစ်သည်။ ဥပမာအားဖြင့်၊ 90% winsorization သည် 95th percentile ၏အထက်တွင် မှတ်သားမှုများ အားလုံးကို 95th percentile မှတန်ဖိုးနှင့် ညီမျှပြီး 5th percentile အောက်ရှိ မှတ်သားမှုများအားလုံးကို 5th percentile မှ တန်ဖိုးနှင့်ညီမျှသည်။ ဤသင်ခန်းစာသည် Excel တွင် ဒေတာအတွဲတစ်ခုကို winsorize လုပ်နည်း အဆင့်ဆင့် ဥပမာကို ပေးပါသည်။...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် stacked point plot တစ်ခုဖန်တီးနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

stacked dot plot သည် အစက်များကို အသုံးပြု၍ ကြိမ်နှုန်းများကိုပြသသည့် ကွက်ကွက်အမျိုးအစားတစ်ခုဖြစ်သည်။ R တွင် stacked point plot ကိုဖန်တီးရန် သင်သုံးနိုင်သော နည်းလမ်းနှစ်ခုရှိသည်။ နည်းလမ်း 1- အခြေခံ R ရှိ stripchart() လုပ်ဆောင်မှု။ နည်းလမ်း 2- ggplot2 ရှိ geom_dotplot() လုပ်ဆောင်ချက်။ ဤသင်ခန်းစာသည် stacked point plot တစ်ခုထုတ်လုပ်ရန် ဤနည်းလမ်းတစ်ခုစီကိုအသုံးပြုပုံအကျဉ်းကို ဥပမာပေးထားသည်။ ဥပမာ 1- အခြေခံ R တွင်...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် ဒေတာကို အလယ်ဗဟိုပြုနည်း (ဥပမာများဖြင့်)

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ဒေတာအစုံကို ဗဟိုပြုခြင်း ဆိုသည်မှာ ဒေတာအစုအတွင်း တစ်ဦးချင်းစီ ကြည့်ရှုမှုတစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို နုတ်ယူခြင်းဖြစ်သည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။ ပျမ်းမျှတန်ဖိုးသည် 14 ဖြစ်ကြောင်း တွေ့ရှိရပါသည်။ ထို့ကြောင့်၊ ဤဒေတာအတွဲကို ဗဟိုပြုရန်၊ တစ်ဦးချင်းစီ ရှုမြင်ချက်တစ်ခုစီမှ 14 ကို နုတ်ယူပါမည်- ဗဟိုပြုဒေတာအတွဲ၏ ပျမ်းမျှတန်ဖိုးသည် သုညဖြစ်ကြောင်း သတိပြုပါ။ ဤကျူတိုရီရယ်တွင် R တွင်ဒေတာကိုဗဟိုပြုပုံဥပမာများစွာကိုပေးသည်။ ဥပမာ 1: vector တစ်ခု၏ တန်ဖိုးများကို ဗဟိုပြုပါ။ အောက်ဖော်ပြပါ ကုဒ်သည် vector တစ်ခုရှိ တန်ဖိုးများကို...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် တိကျသောအတန်းများထည့်နည်း- ဥပမာများဖြင့်

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

R တွင် ဒေတာဘောင်တစ်ခု၏ သီးခြားအတန်းများထည့်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်သည်။ with (df, sum (column_1[column_2 == ' some value '])) ဤ syntax သည် data frame ကို df ဟုခေါ်သော ကော်လံ 2 တွင် တန်ဖိုးတစ်ခုနှင့် ညီမျှသည့် ကော်လံ 1 ၏ အတန်းပေါင်းလဒ်ကို ရှာဖွေသည်။ ဤသင်ခန်းစာသည် အောက်ပါဒေတာဘောင်ဖြင့် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့ကျကျအသုံးပြုနည်း ဥပမာများစွာကို ပေးသည်-...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် အခြားဖော်ပြချက်ဖြစ်ပါက nested တစ်ခုကို မည်သို့ရေးရမည်နည်း (ဥပမာများဖြင့်)

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Base R ရှိ ifelse() လုပ်ဆောင်ချက်ကို လျင်မြန်သော if-else ဖော်ပြချက်များအား ရေးသားရန် အသုံးပြုနိုင်သည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်- ifelse (စမ်းသပ်၊ ဟုတ်၊ မဟုတ်) ရွှေ- စမ်းသပ်မှု- ယုတ္တိဗေဒစမ်းသပ်မှု ဟုတ်သည်- လော့ဂျစ်စမ်းသပ်မှု မှန်ပါက ပြန်ပေးရမည့်တန်ဖိုး နံပါတ်- လော့ဂျစ်စမ်းသပ်မှု မှားပါက ပြန်ပေးရမည့်တန်ဖိုး အောက်ဖော်ပြပါဒေတာဘောင်ကို အသုံးပြု၍ if else statement များအပြင် R ရှိ if else statements များရေးရန်...

[ဆက်လက်ဖတ်ရှုရန်...]