Category: လမ်းညွှန်
Clustering သည် ဒေတာအတွဲတစ်ခုအတွင်း လေ့လာတွေ့ရှိချက် အုပ်စုများ ကို ရှာဖွေရန် ကြိုးစားသည့် စက်သင်ယူမှုနည်းပညာတစ်ခုဖြစ်သည်။ ရည်ရွယ်ချက်မှာ အစုအဝေးတစ်ခုစီအတွင်းရှိ ရှုမြင်သုံးသပ်ချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်တူညီပြီး ကွဲပြားသောအစုအဝေးရှိ လေ့လာတွေ့ရှိချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်ကွဲပြားသည့် အစုအဝေးများကို ရှာဖွေရန်ဖြစ်သည်။ Clustering သည် တုံ့ပြန်မှုကိန်းရှင် ၏တန်ဖိုးကို ခန့်မှန်းမည့်အစား ဒေတာအတွဲတစ်ခုအတွင်း ဖွဲ့စည်းပုံကိုရှာဖွေရန် ရိုးရိုးရှင်းရှင်းကြိုးစားနေသောကြောင့် ကြီးကြပ်ခြင်းမရှိသော သင်ယူမှု ပုံစံတစ်ခုဖြစ်သည်။ လုပ်ငန်းများသည် အောက်ပါကဲ့သို့သော အချက်အလက်များကို ရယူသည့်အခါတွင် စျေးကွက်ရှာဖွေရေးတွင် Clustering ကို အသုံးများပါသည်။ အိမ်ထောင်စုဝင်ငွေ အိမ်ထောင်စု...
Variance သည် ဆိုလိုရင်းတစ်ဝိုက်တွင် ဒေတာတန်ဖိုးများ မည်မျှ ကောင်းမွန်စွာ ဖြန့်ဝေသည်ကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ လူဦးရေ ကွဲပြားမှုကို ရှာဖွေရန် ဖော်မြူလာမှာ- σ 2 = Σ (x i – μ) 2 / N µ သည် လူဦးရေဆိုလိုသည်၊ x i သည် လူဦးရေ၏ i th ဒြပ်စင်ဖြစ်ပြီး N သည် လူဦးရေအရွယ်အစားဖြစ်ပြီး Σ သည် “ ပေါင်း” ဟူသော...
Clustering သည် ဒေတာအတွဲတစ်ခုအတွင်း အုပ်စုများ သို့မဟုတ် စောင့်ကြည့်မှု အစုအဝေးများကို ရှာဖွေရန် ကြိုးစားသည့် စက်သင်ယူမှုနည်းပညာတစ်ခုဖြစ်သည်။ ရည်ရွယ်ချက်မှာ အစုအဝေးတစ်ခုစီအတွင်းရှိ ရှုမြင်သုံးသပ်ချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်တူညီပြီး ကွဲပြားသောအစုအဝေးရှိ လေ့လာတွေ့ရှိချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်ကွဲပြားသည့် အစုအဝေးများကို ရှာဖွေရန်ဖြစ်သည်။ Clustering သည် တုံ့ပြန်မှုကိန်းရှင် ၏တန်ဖိုးကို ခန့်မှန်းမည့်အစား ဒေတာအတွဲတစ်ခုအတွင်း ဖွဲ့စည်းပုံကိုရှာဖွေရန် ရိုးရိုးရှင်းရှင်းကြိုးစားနေသောကြောင့် ကြီးကြပ်ခြင်းမရှိသော သင်ယူမှု ပုံစံတစ်ခုဖြစ်သည်။ လုပ်ငန်းများသည် အောက်ပါကဲ့သို့သော အချက်အလက်များကို ရယူသည့်အခါတွင် စျေးကွက်ရှာဖွေရေးတွင် Clustering ကို အသုံးများပါသည်။ အိမ်ထောင်စုဝင်ငွေ...
ကျောင်းသားအကြွင်းအကျန် သည် ၎င်း၏ခန့်မှန်းစံသွေဖည်မှုဖြင့် ပိုင်းခြားထားသော အကြွင်းတစ်ခုဖြစ်သည်။ လက်တွေ့တွင်၊ ကျောင်းသားအကြွင်းအကျန်သည် 3 ၏ ပကတိတန်ဖိုးထက် ပိုကြီးသော ဒေတာအတွဲတစ်ခုတွင် စောင့်ကြည့်မှု တိုင်းသည် သာလွန်သည်ဟု ကျွန်ုပ်တို့ ယေဘူယျအားဖြင့် ဆိုပါသည်။ အောက်ပါ syntax ကိုအသုံးပြုသည့် MASS ပက်ကေ့ခ်ျမှ studres() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ R ရှိ မည်သည့် ဆုတ်ယုတ်မှုပုံစံ၏ ကျောင်းသားဖြစ်ကျန်နေသည့် အကြွင်းအကျန်များကို လျင်မြန်စွာ ရရှိနိုင်ပါသည်။ studres (မော်ဒယ်) ဘယ် မော်ဒယ်က မဆို linear model...
ကျောင်းသားအကြွင်းအကျန် သည် ၎င်း၏ခန့်မှန်းစံသွေဖည်မှုဖြင့် ပိုင်းခြားထားသော အကြွင်းတစ်ခုဖြစ်သည်။ လက်တွေ့တွင်၊ ကျောင်းသားအကြွင်းအကျန်သည် 3 ၏ ပကတိတန်ဖိုးထက် ပိုများသော ဒေတာအတွဲတစ်ခုတွင် စောင့်ကြည့်မှု တိုင်းသည် သာလွန်သည်ဟု ကျွန်ုပ်တို့ယေဘုယျအားဖြင့် ဆိုကြသည်။ အောက်ပါ syntax ကိုအသုံးပြုသည့် statsmodels ၏ OLSResults.outlier_test() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python ရှိ ဆုတ်ယုတ်မှုပုံစံ၏ ကျောင်းသားဖြစ်ကျန်နေသေးသော အကြွင်းအကျန်များကို ကျွန်ုပ်တို့ အမြန်ရနိုင်သည်- OLSResults.outlier_test() OLSResults သည် statsmodels ols() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ကိုက်ညီသော linear...
box-cox အသွင်ပြောင်းခြင်းသည် ပုံမှန်မဟုတ်သော ဖြန့်ဝေထားသောဒေတာအစုံကို ပိုမို သာမာန်ဖြန့်ဝေမှု အစုအဖြစ်သို့ ပြောင်းလဲရန်အတွက် အသုံးများသောနည်းလမ်းဖြစ်သည်။ ဤနည်းလမ်း၏နောက်ကွယ်တွင် အခြေခံအယူအဆမှာ အောက်ပါဖော်မြူလာကို အသုံးပြု၍ ပြောင်းလဲထားသောဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း ဖြစ်နိုင်ချေနီးစပ်သည့် λ တန်ဖိုးတစ်ခုကို ရှာဖွေရန်ဖြစ်သည်- y(λ) = (y λ – 1) / λ ဆိုလျှင် y ≠ 0 y(λ) = log(y) ဆိုရင် y = 0 scipy.stats.boxcox() လုပ်ဆောင်ချက်ကို အသုံးပြု၍...
Vector နှစ်ခု A နှင့် B ကြားရှိ Manhattan အကွာအဝေး ကို အောက်ပါအတိုင်း တွက်ချက်သည်- Σ|a i – b i | i သည် vector တစ်ခုစီ၏ i th element ဖြစ်သည်။ ဤအကွာအဝေးကို မည်သည့် vector နှစ်ခုကြားရှိ ကွဲပြားမှုကို တိုင်းတာရန် အသုံးပြုပြီး မတူညီသော machine learning algorithms အများအပြားတွင် အသုံးများသည်။ ဤသင်ခန်းစာသည် R ဖြင့်...
Vector နှစ်ခုဖြစ်သည့် A နှင့် B ကြားရှိ Minkowski အကွာအဝေး ကို အောက်ပါအတိုင်း တွက်ချက်သည်- (Σ|a i – b i | p ) 1/p i သည် vector တစ်ခုစီ၏ i th element ဖြစ်ပြီး p သည် integer ဖြစ်သည်။ ဤအကွာအဝေးကို မည်သည့် vector နှစ်ခုကြားရှိ ကွဲပြားမှုကို တိုင်းတာရန် အသုံးပြုပြီး မတူညီသော machine...
ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှု သို့မဟုတ် R တွင် ANOVA ကို သင် လုပ်ဆောင်သောအခါ၊ အထွက်ဇယားများတွင် ခွဲခြမ်းစိတ်ဖြာမှုတွင် အသုံးပြုသည့် ကိန်းရှင်များအတွက် p-တန်ဖိုးများ ပါ၀င်သည်။ ကိန်းရှင်များသည် စာရင်းအင်းအရ သိသာထင်ရှားပါက ဤအဓိပ္ပယ်ကုဒ်များကို ကြယ်အတွဲများ သို့မဟုတ် ဒဿမအမှတ်အဖြစ် ပြသပါသည်။ ဤသည်မှာ မတူညီသော အဓိပ္ပါယ်ကုဒ်များကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံဖြစ်သည် ။ significance code p-value *** [0, 0.001] **(0.001, 0.01] * (0.01, 0.05] . (0.05,...
R တွင် linear regression model နှင့် ကိုက်ညီရန် lm() command ကိုသုံးနိုင်သည်။ regression model ၏ output ကိုပြသရန်၊ ထို့နောက် summary() command ကိုသုံးနိုင်သည်။ ဤသင်ခန်းစာတွင် R ရှိ ဆုတ်ယုတ်မှုအထွက်၏ တန်ဖိုးတစ်ခုစီကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်ကို ဤသင်ခန်းစာတွင် ရှင်းပြထားသည်။ ဥပမာ- R တွင် Regression Output ကို ဘာသာပြန်ခြင်း အောက်ပါကုဒ်သည် hp , drat နှင့် wt ကို...