Category: လမ်းညွှန်

Pandas- ပျမ်းမျှအားတွက်ချက်ရန်နှင့် nans ကိုလျစ်လျူမရှုဘဲ groupby ကိုသုံးပါ။

pandas groupby() လုပ်ဆောင်ချက်ကို ကော်လံတစ်ခုဖြင့် အုပ်စုဖွဲ့ကာ အခြားကော်လံတစ်ခု၏ ပျမ်းမျှတန်ဖိုးကို တွက်ချက်သည့်အခါ၊ ပန်ဒါများသည် မူရင်းအားဖြင့် NaN တန်ဖိုးများကို လျစ်လျူရှုပါမည်။ အကယ်၍ သင်သည် ကော်လံတစ်ခုတွင် NaN တန်ဖိုးများ ရှိနေပါက NaN ကို ပြသလိုပါက၊ အောက်ပါ အခြေခံ အထားအသိုကို အသုံးပြုနိုင်သည်။ df. groupby (' team '). agg ({' points ': lambda x: x. mean (skipna= False...

Pandas- အရွယ်အစား() ဖြင့် groupby() ကို အသုံးပြုပုံ

အုပ်စုတစ်ခုစီအလိုက် ဖြစ်ပွားမှုအရေအတွက်ကိုရေတွက်ရန် ပန်ဒါရှိ groupby() နှင့် size() လုပ်ဆောင်ချက်များဖြင့် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- ကိန်းရှင်ဖြင့် အုပ်စုဖွဲ့ထားသော အဖြစ်အပျက်များကို ရေတွက်ပါ။ df. groupby (' var1 '). size () နည်းလမ်း 2- ကိန်းရှင်များစွာဖြင့် အုပ်စုဖွဲ့ထားသော အဖြစ်အပျက်များကို ရေတွက်ပါ။ df. groupby ([' var1 ', ' var2 ']). size () နည်းလမ်း 3- ကိန်းရှင်များစွာဖြင့်...

Pandas- တန်ဖိုးများကို အပိုင်းအခြားအလိုက် အုပ်စုဖွဲ့နည်း

ပေါင်းစည်းခြင်းမလုပ်ဆောင်မီ ကော်လံတစ်ခုအား တန်ဖိုးများအကွာအဝေးအလိုက် အုပ်စုဖွဲ့ရန်အတွက် ပန်ဒါရှိ groupby() လုပ်ဆောင်ချက်ကို အသုံးပြုရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။ df. groupby (pd. cut (df[' my_column '], [0, 25, 50, 75, 100])). sum () ဤဥပမာသည် my_column ဟုခေါ်သော ကော်လံရှိ အောက်ပါတန်ဖိုးများ၏ အကွာအဝေးအရ DataFrame ၏အတန်းများကို အုပ်စုဖွဲ့လိမ့်မည်- (၀.၂၅] (၂၅၊ ၅၀]၊ (၅၀၊ ၇၅)၊ (၇၅၊...

R ဖြင့် စာလုံးရေတွက်နည်း (ဥပမာများဖြင့်)

R တွင် စာကြောင်းတစ်ခုရှိ စကားလုံးအရေအတွက်ကို ရေတွက်ရန် သင်သုံးနိုင်သော နည်းလမ်းသုံးမျိုးရှိသည်။ နည်းလမ်း 1- Base R ကိုသုံးပါ။ lengths(strsplit(my_string, ' ')) နည်းလမ်း 2- stringi package ကိုသုံးပါ။ library (stringi) stri_count_words(my_string) နည်းလမ်း 3- stringr package ကိုသုံးပါ။ library (stringr) str_count(my_string, ' \\w+ ') ဤနည်းလမ်းတစ်ခုစီသည် my_string ဟုခေါ်သော စာကြောင်းရှိ စကားလုံးအရေအတွက်ကို ကိုယ်စားပြုသည့် ဂဏန်းတန်ဖိုးကို...

A- မျဉ်းသားအများအပြားဖြင့် strsplit() ကို မည်သို့အသုံးပြုရမည်နည်း။

ကန့်သတ်ချက်များစွာကိုအခြေခံ၍ စာကြောင်းတစ်ခုကို အပိုင်းပိုင်းခွဲရန် R ရှိ strsplit() လုပ်ဆောင်ချက်ဖြင့် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်- strsplit(my_string, ' [,& ]+ ') အောက်ဖော်ပြပါ ကန့်သတ်ချက်သုံးခုထဲမှ တစ်ခုကို တွေ့ကြုံရတိုင်း ဤဥပမာသည် my_string ဟုခေါ်သော စာကြောင်းကို ပိုင်းခြားပေးသည်- ကော်မာ ( , ) အသံချဲ့စက် ( & ) ဧရိယာတစ်ခု ကွင်းအတွင်းရှိ အက္ခရာများသည် ရှာဖွေရန် မည်သည့် မျဉ်းသားချက်များကို ညွှန်ပြသည်ကို သတိပြုပါ၊...

A: ထူးခြားသောတန်ဖိုးများကိုရှာဖွေပြီး ၎င်းတို့ကို အမျိုးအစားခွဲနည်း

ထူးခြားသောတန်ဖိုးများကိုရှာဖွေရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပြီး ၎င်းတို့ကို R တွင် စီရန်- Method 1: Vector တစ်ခုတွင် ထူးခြားသောတန်ဖိုးများကို ရှာပြီး ၎င်းတို့ကို စီပါ။ #get unique values sorted in ascending order sort(unique(data)) နည်းလမ်း 2- ဒေတာဘောင်ရှိ ထူးခြားသောအတန်းများကို ရှာပြီး ၎င်းတို့ကို စီပါ။ #remove duplicate rows in data frame df_new = df[!duplicated(df), ] #display...

Pandas- describe() ကို အသုံးပြုနည်းနှင့် သိပ္ပံဆိုင်ရာ အမှတ်အသားများကို ဖယ်ရှားနည်း

pandas DataFrame အတွင်းရှိ variable များအတွက် descriptive statistics ကို ဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ describe() လုပ်ဆောင်ချက်၏ output မှ သိပ္ပံဆိုင်ရာ အမှတ်အသားများကို ဖယ်ရှားရန်၊ သင်သည် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- ကော်လံတစ်ခုဖြင့် describe() ကိုအသုံးပြုသောအခါ သိပ္ပံဆိုင်ရာအမှတ်အသားများကို ဖယ်ရှားပါ။ df[' my_column ']. describe (). apply ( lambda x: format (x, '...

Pandas- သတ်မှတ်ထားသော ရာခိုင်နှုန်းများနှင့်အတူ describe() ကို အသုံးပြုပုံ

pandas DataFrame အတွင်းရှိ variable များအတွက် descriptive statistics ကို ဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ပုံမှန်အားဖြင့်၊ ပန်ဒါများသည် ကိန်းရှင်များအတွက် 25th၊ 50th နှင့် 75th ရာခိုင်နှုန်းများကို တွက်ချက်သည်။ သို့သော်၊ တွက်ချက်ရန် အတိအကျ ရာခိုင်နှုန်းများကို သတ်မှတ်ရန် describe() လုပ်ဆောင်ချက်ရှိ ရာခိုင်နှုန်း အငြင်းပွားမှုကို သင်အသုံးပြုနိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာများသည် အောက်ပါ ပန်ဒါ DataFrame နှင့် လက်တွေ့တွင် ဤအငြင်းအခုံကို အသုံးပြုနည်းကို ပြသသည်-...

Pandas- mean နှင့် std အတွက် describe() ကို ဘယ်လိုသုံးမလဲ။

pandas DataFrame အတွင်းရှိ variable များအတွက် descriptive statistics ကို ဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ပုံသေအားဖြင့်၊ describe() လုပ်ဆောင်ချက်သည် DataFrame တစ်ခုရှိ ကိန်းဂဏာန်းတစ်ခုစီအတွက် အောက်ပါမက်ထရစ်များကို တွက်ချက်သည်- count (တန်ဖိုးအရေအတွက်) ပျမ်းမျှ (ပျမ်းမျှတန်ဖိုး) std (စံသွေဖည်) အနည်းဆုံး (အနည်းဆုံးတန်ဖိုး) 25% (25th ရာခိုင်နှုန်း) 50% (50th ရာခိုင်နှုန်း) 75% (75th ရာခိုင်နှုန်း) အမြင့်ဆုံး (အမြင့်ဆုံးတန်ဖိုး) သို့သော်၊ ကိန်းဂဏာန်းတစ်ခုစီ၏...

Pandas- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် describe() ကို မည်သို့အသုံးပြုရမည်နည်း။

ပုံမှန်အားဖြင့်၊ ပန်ဒါရှိ describe() လုပ်ဆောင်ချက်သည် DataFrame ရှိ ကိန်းဂဏာန်းကိန်းရှင်အားလုံးအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ပေးပါသည်။ သို့သော်၊ အမျိုးအစားခွဲကိန်းရှင်များ အတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။ df. describe (include=' object ') ဤနည်းလမ်းသည် DataFrame တစ်ခုရှိ အမျိုးအစားအလိုက် ကိန်းရှင်တစ်ခုစီအတွက် အရေအတွက် ၊ ထူးခြားသော ၊ ထိပ်တန်း နှင့် ကြိမ်နှုန်းများ ကို တွက်ချက်ပေးမည်ဖြစ်သည်။...