Category: လမ်းညွှန်

R တွင် k-means clustering- အဆင့်ဆင့် ဥပမာ

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Clustering သည် ဒေတာအတွဲတစ်ခုအတွင်း လေ့လာတွေ့ရှိချက် အုပ်စုများ ကို ရှာဖွေရန် ကြိုးစားသည့် စက်သင်ယူမှုနည်းပညာတစ်ခုဖြစ်သည်။ ရည်ရွယ်ချက်မှာ အစုအဝေးတစ်ခုစီအတွင်းရှိ ရှုမြင်သုံးသပ်ချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်တူညီပြီး ကွဲပြားသောအစုအဝေးရှိ လေ့လာတွေ့ရှိချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်ကွဲပြားသည့် အစုအဝေးများကို ရှာဖွေရန်ဖြစ်သည်။ Clustering သည် တုံ့ပြန်မှုကိန်းရှင် ၏တန်ဖိုးကို ခန့်မှန်းမည့်အစား ဒေတာအတွဲတစ်ခုအတွင်း ဖွဲ့စည်းပုံကိုရှာဖွေရန် ရိုးရိုးရှင်းရှင်းကြိုးစားနေသောကြောင့် ကြီးကြပ်ခြင်းမရှိသော သင်ယူမှု ပုံစံတစ်ခုဖြစ်သည်။ လုပ်ငန်းများသည် အောက်ပါကဲ့သို့သော အချက်အလက်များကို ရယူသည့်အခါတွင် စျေးကွက်ရှာဖွေရေးတွင် Clustering ကို အသုံးများပါသည်။ အိမ်ထောင်စုဝင်ငွေ အိမ်ထောင်စု...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် နမူနာနှင့် လူဦးရေကွဲလွဲမှုကို တွက်ချက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Variance သည် ဆိုလိုရင်းတစ်ဝိုက်တွင် ဒေတာတန်ဖိုးများ မည်မျှ ကောင်းမွန်စွာ ဖြန့်ဝေသည်ကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ လူဦးရေ ကွဲပြားမှုကို ရှာဖွေရန် ဖော်မြူလာမှာ- σ 2 = Σ (x i – μ) 2 / N µ သည် လူဦးရေဆိုလိုသည်၊ x i သည် လူဦးရေ၏ i th ဒြပ်စင်ဖြစ်ပြီး N သည် လူဦးရေအရွယ်အစားဖြစ်ပြီး Σ သည် “ ပေါင်း” ဟူသော...

[ဆက်လက်ဖတ်ရှုရန်...]

R ရှိ k-medoids- အဆင့်ဆင့် ဥပမာ

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Clustering သည် ဒေတာအတွဲတစ်ခုအတွင်း အုပ်စုများ သို့မဟုတ် စောင့်ကြည့်မှု အစုအဝေးများကို ရှာဖွေရန် ကြိုးစားသည့် စက်သင်ယူမှုနည်းပညာတစ်ခုဖြစ်သည်။ ရည်ရွယ်ချက်မှာ အစုအဝေးတစ်ခုစီအတွင်းရှိ ရှုမြင်သုံးသပ်ချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်တူညီပြီး ကွဲပြားသောအစုအဝေးရှိ လေ့လာတွေ့ရှိချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်ကွဲပြားသည့် အစုအဝေးများကို ရှာဖွေရန်ဖြစ်သည်။ Clustering သည် တုံ့ပြန်မှုကိန်းရှင် ၏တန်ဖိုးကို ခန့်မှန်းမည့်အစား ဒေတာအတွဲတစ်ခုအတွင်း ဖွဲ့စည်းပုံကိုရှာဖွေရန် ရိုးရိုးရှင်းရှင်းကြိုးစားနေသောကြောင့် ကြီးကြပ်ခြင်းမရှိသော သင်ယူမှု ပုံစံတစ်ခုဖြစ်သည်။ လုပ်ငန်းများသည် အောက်ပါကဲ့သို့သော အချက်အလက်များကို ရယူသည့်အခါတွင် စျေးကွက်ရှာဖွေရေးတွင် Clustering ကို အသုံးများပါသည်။ အိမ်ထောင်စုဝင်ငွေ...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် ကျောင်းသားဖြစ်ကျန်နေမှုများကို တွက်ချက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ကျောင်းသားအကြွင်းအကျန် သည် ၎င်း၏ခန့်မှန်းစံသွေဖည်မှုဖြင့် ပိုင်းခြားထားသော အကြွင်းတစ်ခုဖြစ်သည်။ လက်တွေ့တွင်၊ ကျောင်းသားအကြွင်းအကျန်သည် 3 ၏ ပကတိတန်ဖိုးထက် ပိုကြီးသော ဒေတာအတွဲတစ်ခုတွင် စောင့်ကြည့်မှု တိုင်းသည် သာလွန်သည်ဟု ကျွန်ုပ်တို့ ယေဘူယျအားဖြင့် ဆိုပါသည်။ အောက်ပါ syntax ကိုအသုံးပြုသည့် MASS ပက်ကေ့ခ်ျမှ studres() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ R ရှိ မည်သည့် ဆုတ်ယုတ်မှုပုံစံ၏ ကျောင်းသားဖြစ်ကျန်နေသည့် အကြွင်းအကျန်များကို လျင်မြန်စွာ ရရှိနိုင်ပါသည်။ studres (မော်ဒယ်) ဘယ် မော်ဒယ်က မဆို linear model...

[ဆက်လက်ဖတ်ရှုရန်...]

Python တွင် ကျောင်းသားဖြစ်ထားသော အကြွင်းအကျန်များကို တွက်ချက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ကျောင်းသားအကြွင်းအကျန် သည် ၎င်း၏ခန့်မှန်းစံသွေဖည်မှုဖြင့် ပိုင်းခြားထားသော အကြွင်းတစ်ခုဖြစ်သည်။ လက်တွေ့တွင်၊ ကျောင်းသားအကြွင်းအကျန်သည် 3 ၏ ပကတိတန်ဖိုးထက် ပိုများသော ဒေတာအတွဲတစ်ခုတွင် စောင့်ကြည့်မှု တိုင်းသည် သာလွန်သည်ဟု ကျွန်ုပ်တို့ယေဘုယျအားဖြင့် ဆိုကြသည်။ အောက်ပါ syntax ကိုအသုံးပြုသည့် statsmodels ၏ OLSResults.outlier_test() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python ရှိ ဆုတ်ယုတ်မှုပုံစံ၏ ကျောင်းသားဖြစ်ကျန်နေသေးသော အကြွင်းအကျန်များကို ကျွန်ုပ်တို့ အမြန်ရနိုင်သည်- OLSResults.outlier_test() OLSResults သည် statsmodels ols() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ကိုက်ညီသော linear...

[ဆက်လက်ဖတ်ရှုရန်...]

Python တွင် box-cox အသွင်ပြောင်းနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

box-cox အသွင်ပြောင်းခြင်းသည် ပုံမှန်မဟုတ်သော ဖြန့်ဝေထားသောဒေတာအစုံကို ပိုမို သာမာန်ဖြန့်ဝေမှု အစုအဖြစ်သို့ ပြောင်းလဲရန်အတွက် အသုံးများသောနည်းလမ်းဖြစ်သည်။ ဤနည်းလမ်း၏နောက်ကွယ်တွင် အခြေခံအယူအဆမှာ အောက်ပါဖော်မြူလာကို အသုံးပြု၍ ပြောင်းလဲထားသောဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း ဖြစ်နိုင်ချေနီးစပ်သည့် λ တန်ဖိုးတစ်ခုကို ရှာဖွေရန်ဖြစ်သည်- y(λ) = (y λ – 1) / λ ဆိုလျှင် y ≠ 0 y(λ) = log(y) ဆိုရင် y = 0 scipy.stats.boxcox() လုပ်ဆောင်ချက်ကို အသုံးပြု၍...

[ဆက်လက်ဖတ်ရှုရန်...]

မန်ဟက်တန်အကွာအဝေးကို r (ဥပမာများဖြင့်) တွက်ချက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Vector နှစ်ခု A နှင့် B ကြားရှိ Manhattan အကွာအဝေး ကို အောက်ပါအတိုင်း တွက်ချက်သည်- Σ|a i – b i | i သည် vector တစ်ခုစီ၏ i th element ဖြစ်သည်။ ဤအကွာအဝေးကို မည်သည့် vector နှစ်ခုကြားရှိ ကွဲပြားမှုကို တိုင်းတာရန် အသုံးပြုပြီး မတူညီသော machine learning algorithms အများအပြားတွင် အသုံးများသည်။ ဤသင်ခန်းစာသည် R ဖြင့်...

[ဆက်လက်ဖတ်ရှုရန်...]

Minkowski အကွာအဝေးကို r (ဥပမာများဖြင့်) တွက်ချက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Vector နှစ်ခုဖြစ်သည့် A နှင့် B ကြားရှိ Minkowski အကွာအဝေး ကို အောက်ပါအတိုင်း တွက်ချက်သည်- (Σ|a i – b i | p ) 1/p i သည် vector တစ်ခုစီ၏ i th element ဖြစ်ပြီး p သည် integer ဖြစ်သည်။ ဤအကွာအဝေးကို မည်သည့် vector နှစ်ခုကြားရှိ ကွဲပြားမှုကို တိုင်းတာရန် အသုံးပြုပြီး မတူညီသော machine...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် အဓိပ္ပါယ်ဖွင့်ဆိုပုံ

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှု သို့မဟုတ် R တွင် ANOVA ကို သင် လုပ်ဆောင်သောအခါ၊ အထွက်ဇယားများတွင် ခွဲခြမ်းစိတ်ဖြာမှုတွင် အသုံးပြုသည့် ကိန်းရှင်များအတွက် p-တန်ဖိုးများ ပါ၀င်သည်။ ကိန်းရှင်များသည် စာရင်းအင်းအရ သိသာထင်ရှားပါက ဤအဓိပ္ပယ်ကုဒ်များကို ကြယ်အတွဲများ သို့မဟုတ် ဒဿမအမှတ်အဖြစ် ပြသပါသည်။ ဤသည်မှာ မတူညီသော အဓိပ္ပါယ်ကုဒ်များကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံဖြစ်သည် ။ significance code p-value *** [0, 0.001] **(0.001, 0.01] * (0.01, 0.05] . (0.05,...

[ဆက်လက်ဖတ်ရှုရန်...]

R တွင် regression output ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

R တွင် linear regression model နှင့် ကိုက်ညီရန် lm() command ကိုသုံးနိုင်သည်။ regression model ၏ output ကိုပြသရန်၊ ထို့နောက် summary() command ကိုသုံးနိုင်သည်။ ဤသင်ခန်းစာတွင် R ရှိ ဆုတ်ယုတ်မှုအထွက်၏ တန်ဖိုးတစ်ခုစီကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်ကို ဤသင်ခန်းစာတွင် ရှင်းပြထားသည်။ ဥပမာ- R တွင် Regression Output ကို ဘာသာပြန်ခြင်း အောက်ပါကုဒ်သည် hp , drat နှင့် wt ကို...

[ဆက်လက်ဖတ်ရှုရန်...]