Category: လမ်းညွှန်

ဖိုင်များကိုပိုမိုမြန်ဆန်စွာတင်သွင်းရန် r တွင် fread() ကိုအသုံးပြုနည်း

ဖိုင်များကို လျင်မြန်လွယ်ကူစွာ တင်သွင်းရန် R ရှိ data.table package ၏ fread() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်- library (data.table) df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ") ဖိုင်ကြီးများအတွက်၊ ဤလုပ်ဆောင်ချက်သည် အခြေခံ R မှ read.csv ကဲ့သို့သော လုပ်ဆောင်ချက်များထက် သိသိသာသာ ပိုမြန်သည်ကို တွေ့ရှိရပါသည်။ ကိစ္စအများစုတွင်၊ ဤလုပ်ဆောင်ချက်သည် သင်တင်သွင်းနေသည့် ဒေတာအတွဲအတွက် ကန့်သတ်ချက်နှင့် ကော်လံအမျိုးအစားများကို အလိုအလျောက် သိရှိနိုင်သည်။...

Pandas- groupby ကိုအသုံးပြုနည်းနှင့် အခြေအနေအရ ရေတွက်နည်း

အဖွဲ့လိုက်လုပ်ဆောင်ရန်နှင့် pandas DataFrame တွင် အခြေအနေအလိုက် ရေတွက်ရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- df. groupby (' var1 ')[' var2 ']. apply ( lambda x:(x==' val '). sum ()). reset_index (name=' count ') ဤ သီးခြား syntax သည် var1 ကိုအခြေခံ၍ DataFrame ၏အတန်းများကိုစုဖွဲ့ပြီး var2 “ val” နှင့်...

Pandas- အခြေအနေဖြင့် ကော်လံတစ်ခုတွင် တန်ဖိုးများကို ရေတွက်နည်း

Pandas DataFrame ကော်လံတွင် သတ်မှတ်ထားသော အခြေအနေတစ်ခုဖြင့် တန်ဖိုးအရေအတွက်များကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- အခြေအနေဖြင့် ကော်လံတစ်ခုတွင် တန်ဖိုးများကို ရေတွက်ပါ။ len(df[df[' col1 ']==' value1 ']) နည်းလမ်း 2- အခြေအနေများဖြင့် ကော်လံများစွာတွင် တန်ဖိုးများကို ရေတွက်ပါ။ len(df[(df[' col1 ']==' value1 ') & (df[' col2 ']==' value2 ')]) အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame...

Pandas dataframe တွင် နံပါတ်ကော်လံတစ်ခုကို မည်သို့ထည့်မည်နည်း။

Pandas DataFrame တွင် “ count” ကော်လံတစ်ခုထည့်ရန် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ') ဤ သီးခြား syntax သည် var1_count ဟုခေါ်သော ကော်လံတစ်ခုကို var1 ဟုခေါ်သော ကော်လံတွင် တန်ဖိုးအရေအတွက်များပါရှိသော DataFrame သို့ ပေါင်းထည့်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ...

Pandas- သီးခြားကော်လံများနှင့်အတူ fillna() ကိုအသုံးပြုနည်း

ပန်ဒါ DataFrame ၏ သီးခြားကော်လံများတွင် NaN တန်ဖိုးများကို အစားထိုးရန် အောက်ပါနည်းလမ်းများကို fillna() ဖြင့် အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- သီးခြားကော်လံတစ်ခုဖြင့် fillna() ကိုသုံးပါ။ df[' col1 '] = df[' col1 ']. fillna (0) နည်းလမ်း 2- သီးခြားကော်လံများစွာဖြင့် fillna() ကိုသုံးပါ။ df[[' col1 ', ' col2 ']] = df[[' col1 ', '...

Pandas- ဘားကွက်တစ်ခုတွင် ဘားများကို မှတ်သားနည်း

ပန်ဒါဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- ရိုးရှင်းသော ဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားပါ။ ax = df. plot . bar () ax. bar_label ( ax.containers [ 0 ]) နည်းလမ်း 2- အုပ်စုဖွဲ့ထားသော ဘားကွက်ကွက်တွင် ဘားများကို မှတ်သားပါ။ ax = df. plot . bar () for container in...

Python တွင် normality ကိုစမ်းသပ်နည်း (နည်းလမ်း 4 ခု)

ကိန်းဂဏန်းစစ်ဆေးမှုများစွာသည် ဒေတာအစုံများကို ပုံမှန်ဖြန့်ဝေသည်ဟု ယူဆသည် ။ Python တွင် ဤယူဆချက်ကို စစ်ဆေးရန် ဘုံနည်းလမ်းလေးခုရှိသည်။ 1. (အမြင်နည်းလမ်း) ဟီစတိုဂရမ်တစ်ခု ဖန်တီးပါ။ ဟီစတိုဂရမ်သည် ခန့်မှန်းခြေအားဖြင့် “ ခေါင်းလောင်း” ပုံသဏ္ဍာန်ဖြစ်ပါက၊ ဒေတာကို ပုံမှန်အတိုင်း ဖြန့်ဝေသည်ဟု ယူဆပါသည်။ 2. (Visual method) QQ ကွက်ကွက်ဖန်တီးပါ။ ကွက်လပ်ပေါ်ရှိ အမှတ်များသည် ဖြောင့်ထောင့်ဖြတ်မျဉ်းတစ်လျှောက် အကြမ်းဖျင်းအားဖြင့် တည်ရှိနေပါက ဒေတာကို ပုံမှန်အတိုင်း ဖြန့်ဝေသည်ဟု ယူဆပါသည်။ 3. (တရားဝင်စာရင်းအင်းစမ်းသပ်မှု) Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်ပါ။...

R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းတွက်ချက်နည်း (ဥပမာနှင့်အတူ)

R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းတစ်ခုကို တွက်ချက်ရန် အောက်ပါ syntax ကို သင်သုံးနိုင်သည်။ library (dplyr) df %>% group_by(group_var) %>% mutate(percent = value_var/sum(value_var)) အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။ ဥပမာ- R တွင် အုပ်စုအလိုက် ရာခိုင်နှုန်းကို တွက်ချက်ပါ။ မတူညီသောအသင်းများမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် အောက်ပါဒေတာဘောင်တစ်ခုရှိသည်ဆိုပါစို့။ #create data frame df <-...

ကြားကာလ vs. interquartile range- ကွာခြားချက်ကဘာလဲ။

ကိန်းဂဏန်းစာရင်းဇယားများတွင် ကြားကာလ နှင့် ကြားကာလအပိုင်းအခြား သည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဖြူးမှုကို တိုင်းတာသည့်နည်းလမ်းနှစ်သွယ်ဖြစ်သည်။ အပိုင်းအခြားသည် ဒေတာအစုံရှိ အနိမ့်ဆုံးတန်ဖိုးနှင့် အမြင့်ဆုံးတန်ဖိုးအကြား ကွာခြားချက်ကို တိုင်းတာသည်။ ဒေတာ အတွဲ တစ်ခုတွင် ပထမ quartile (25th percentile) နှင့် တတိယ quartile (75th percentile) ကြားခြားနားချက်ကို တိုင်းတာသည်။ ၎င်းသည် တန်ဖိုးများ၏ အလယ် 50% ၏ ဖြန့်ဖြူးမှုကို ကိုယ်စားပြုသည်။ ဥပမာ- ကြားကာလနှင့် ကြားကာလအပိုင်းအခြားကို တွက်ချက်နည်း ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။...

ယူဆချက်စမ်းသပ်ခြင်းနှင့် ယုံကြည်မှုကြားကာလ- ကွာခြားချက်မှာ အဘယ်နည်း။

စာရင်းဇယားများတွင် အသုံးအများဆုံးလုပ်ထုံးလုပ်နည်းနှစ်ခုမှာ သီအိုရီစမ်းသပ်ခြင်း နှင့် ယုံကြည်မှုကြားကာလများ ဖြစ်သည်။ ဤသည်မှာ ၎င်းတို့နှစ်ခုကြား ခြားနားချက်ဖြစ်သည်- သီအိုရီစစ်ဆေးမှု သည် လူဦးရေကန့်သတ်ချက်နှင့်ပတ်သက်သော ယူဆချက်တစ်ခုဟုတ်မဟုတ် ဆုံးဖြတ်ရန်အသုံးပြုသည့် တရားဝင်စာရင်းအင်းစမ်းသပ်မှုတစ်ခုဖြစ်သည်။ ယုံကြည်မှုကြားကာလ သည် ယုံကြည်စိတ်ချမှုအဆင့်တစ်ခုရှိ လူဦးရေကန့်သတ်ချက်ပါ၀င်နိုင်ခြေရှိသော တန်ဖိုးများအကွာအဝေးတစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာသည် နည်းလမ်းတစ်ခုစီ၏ အကျဉ်းချုပ်ကို ၎င်းတို့၏ တူညီမှုနှင့် ကွဲပြားမှုများနှင့်အတူ မျှဝေထားသည်။ Hypothesis စမ်းသပ်ခြင်း၏အခြေခံများ လူဦးရေကန့်သတ်ချက် နှင့်ပတ်သက်သော ယူဆချက်သည် မှန်ကန်ခြင်းရှိ၊ မရှိ စမ်းသပ်ရန် စမ်းသပ်မှုတစ်ခုအား အသုံးပြုသည်။ လက်တွေ့ကမ္ဘာ သီအိုရီစမ်းသပ်မှုကို လုပ်ဆောင်ရန်၊ သုတေသီများသည်...