Category: လမ်းညွှန်

Binomial ဖြန့်ဖြူးခြင်း၏ ယူဆချက် သုံးခု

binomial distribution သည် ပုံသေစမ်းသပ်မှုအရေအတွက်တစ်ခုထက် ဖြစ်ပျက်နေသည့် အချို့သော “ အောင်မြင်မှုများ” ၏ဖြစ်နိုင်ခြေကို စံနမူနာပြုရန် အသုံးပြုသော ဖြစ်နိုင်ခြေဖြန့်ဖြူးမှုတစ်ခုဖြစ်သည်။ အောက်ဖော်ပြပါ ယူဆချက်သုံးရပ်နှင့် ကိုက်ညီပါက binomial distribution ကို အသုံးပြုရန် သင့်လျော်သည်- ယူဆချက် 1- စမ်းသပ်မှုတစ်ခုစီတွင် ဖြစ်နိုင်ချေ ရလဒ်နှစ်ခုသာရှိသည်။ စမ်းသပ်မှုတစ်ခုစီတွင် ဖြစ်နိုင်ချေ ရလဒ်နှစ်ခုသာရှိသည်ဟု ကျွန်ုပ်တို့ယူဆပါသည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် အကြွေစေ့တစ်ခုကို အကြိမ် 100 လွှင့်ပစ်ပါက၊ တစ်ကြိမ်လျှင် ဖြစ်နိုင်သော ရလဒ်နှစ်ခုသာ ဖြစ်နိုင်သည်- ဦးခေါင်း သို့မဟုတ်...

အစက်ချကွက်တစ်ခု၏ အလယ်ဗဟိုကို ရှာဖွေနည်း

အ စက်ချကွက် ဆိုသည်မှာ stacked အမှတ်များကို အသုံးပြု၍ ဒေတာအတွဲတစ်ခုတွင် တန်ဖိုးများ၏ ကြိမ်နှုန်းများကိုပြသသည့် ကွက်ကွက်အမျိုးအစားတစ်ခုဖြစ်သည်။ မကြာခဏ ကျွန်ုပ်တို့သည် အစက်ချကွက်တစ်ခုကို ဖန်တီးသောအခါ၊ ကျွန်ုပ်တို့သည် အလယ်ဗဟိုနှင့် ဖြန့်ဖြူးမှုကို တွက်ချက်လိုသည်- Center : ဒေတာအတွဲ၏ ဗဟိုအချက်။ ဒါကို တိုင်းတာဖို့ အလယ်အလတ်ကို မကြာခဏ သုံးပါတယ်။ Spread : ဒေတာအတွဲတွင် တန်ဖိုးများ ဖြန့်ဖြူးခြင်း။ ဒါကို တိုင်းတာဖို့ အကွာအဝေးကို သုံးလေ့ရှိပါတယ်။ ဤတန်ဖိုးနှစ်ခုကို သိရုံဖြင့် ကျွန်ုပ်တို့သည် ပေးထားသောဒေတာအစုတစ်ခုတွင် တန်ဖိုးများကို...

Histograms ပုံသဏ္ဍာန်ကို ဖော်ပြနည်း- ဥပမာများဖြင့်

ဟီစတိုဂရမ် ဆိုသည်မှာ ဒေတာအစုတစ်ခုတွင် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာအောင် မြင်နိုင်စေသည့် ဇယားအမျိုးအစားတစ်ခုဖြစ်သည်။ X-axis သည် dataset ၏တန်ဖိုးများကိုပြသပြီး Y-axis သည်တန်ဖိုးတစ်ခုစီ၏ကြိမ်နှုန်းကိုပြသသည်။ ဒေတာအစုံရှိတန်ဖိုးများပေါ်မူတည်၍ ဟီစတိုဂရမ်တစ်ခုသည် မတူညီသောပုံသဏ္ဍာန်များစွာကို ယူဆောင်နိုင်သည်။ အောက်ပါဥပမာများသည် မတူညီသော histograms အမျိုးမျိုးကို ဖော်ပြနည်းကို ပြသထားသည်။ 1. ခေါင်းလောင်းပုံသဏ္ဌာန် ဟစ်စတိုဂရမ်တစ်ခုသည် “ ခေါင်းလောင်း” မျဉ်းကွေးနှင့်တူပါက ဘဲလ်ပုံသဏ္ဍာန်ဖြစ်ပြီး ဖြန့်ဝေမှုအလယ်တွင် အထွတ်အထိပ်တစ်ခုရှိသည်။ ဤဖြန့်ဖြူးမှုအမျိုးအစား၏ အတွေ့ရအများဆုံး လက်တွေ့ကမ္ဘာဥပမာမှာ သာမန်ဖြန့်ဖြူးခြင်း ပင်ဖြစ်သည်။ 2. ယူနီဖောင်း ဒေတာအတွဲတစ်ခုစီရှိ...

Google sheets တွင် outliers များကို အလွယ်တကူ ရှာနည်း

Outlier သည် ဒေတာအတွဲတစ်ခုရှိ အခြားတန်ဖိုးများနှင့် ပုံမှန်မဟုတ်စွာ ဝေးကွာနေသော စူးစမ်းမှုတစ်ခုဖြစ်သည်။ တတိယ quartile ထက် 1.5 ဆ သို့မဟုတ် ပထမ quartile အောက်ရှိ interquartile အပိုင်းအခြား 1.5 ဆ သို့မဟုတ် interquartile အကွာအဝေးထက် 1.5 ဆ ဖြစ်ပါက ရှုမြင်မှုအား အကြမ်းဖျင်းအဖြစ် သတ်မှတ်ပါသည်။ မှတ်ချက်- interquartile အပိုင်းအခြားသည် ဒေတာအစုတစ်ခု၏ တတိယမြောက် quartile (75th percentile) နှင့် ပထမ quartile (25th...

ပြီးပြည့်စုံသောလမ်းညွှန်- ယုံကြည်မှုကြားကာလများကို မည်သို့အစီရင်ခံမည်နည်း။

ယုံကြည်မှုကြားကာလ သည် ယုံကြည်စိတ်ချမှုအဆင့်တစ်ခုရှိ လူဦးရေကန့်သတ်ချက်ပါ၀င်နိုင်ခြေရှိသော တန်ဖိုးများအကွာအဝေးတစ်ခုဖြစ်သည်။ ယုံကြည်မှုကြားကာလများကို ကျွန်ုပ်တို့အစီရင်ခံသောအခါ၊ ကျွန်ုပ်တို့သည် အောက်ပါဖော်မတ်ကို အမြဲအသုံးပြုသည်- 95% CI [LL, UL] ရွှေ LL : ယုံကြည်မှုကြားကာလ၏ ကန့်သတ်ချက်အောက် UL : ယုံကြည်မှုကြားကာလ၏ အထက်ကန့်သတ်ချက် အောက်ဖော်ပြပါနမူနာများသည် လက်တွေ့တွင် မတူညီသော စာရင်းအင်းစစ်ဆေးမှုများအတွက် ယုံကြည်မှုကြားကာလများကို မည်သို့အစီရင်ခံရမည်ကို ပြသထားသည်။ ဥပမာ 1- ဆိုလိုရင်းအတွက် ယုံကြည်မှုကြားကာလ ဇီဝဗေဒပညာရှင်တစ်ဦးသည် လိပ်မျိုးစိတ်တစ်ခု၏ ပျမ်းမျှအလေးချိန်ကို သိလိုသည်ဆိုပါစို့။ သူမသည် ကျပန်းနမူနာ 25...

ကိုင်တွယ်နည်း- glm.fit- ဂဏန်းများဖြင့် ချိန်ညှိထားသော ဖြစ်နိုင်ခြေ 0 သို့မဟုတ် 1 ဖြစ်ပေါ်သည်။

R တွင် သင်တွေ့နိုင်သောသတိပေးစာမှာ- Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred သင်သည် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို အံဝင်ခွင်ကျဖြစ်စေသောအခါတွင် ဤသတိပေးချက်သည် သင့်ဒေတာဘေ့စ်ရှိ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော စူးစမ်းလေ့လာမှုများ၏ ဖြစ်နိုင်ခြေများကို 0 သို့မဟုတ် 1 နှင့် ခွဲခြား၍မရပါ။ ဤသည်မှာ သတိပေးစာ ဖြစ်ပြီး အမှားအယွင်းမဟုတ်ကြောင်း သတိပြုပါ။ ဤအမှားကို သင်လက်ခံရရှိလျှင်ပင်၊ သင်၏ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် အံဝင်ခွင်ကျဖြစ်နေဆဲဖြစ်သည်၊ သို့သော်...

Python တွင်ဒေတာကိုပုံမှန်ဖြစ်အောင်လုပ်နည်း

ကိန်းဂဏန်းများနှင့် စက်သင်ယူမှုတွင် မကြာခဏဆိုသလို ကျွန်ုပ်တို့သည် တန်ဖိုးများ၏ အကွာအဝေး 0 နှင့် 1 အကြားဖြစ်သည့် ကိန်းရှင်များကို ပုံမှန်ပြုလုပ်သည် ။ ကိန်းရှင်များကို ပုံမှန်ဖြစ်အောင် ပြုလုပ်ခြင်း၏ အဖြစ်အများဆုံး အကြောင်းရင်းမှာ ကျွန်ုပ်တို့သည် အမျိုးမျိုးကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု အမျိုးအစားအချို့ကို လုပ်ဆောင်နေချိန် (ဆိုလိုသည်မှာ ခန့်မှန်းသူကိန်းရှင်များစွာနှင့် တုံ့ပြန်မှုကိန်းရှင်တစ်ခုကြား ဆက်စပ်မှုကို နားလည်လိုသည်) နှင့် ကိန်းရှင်တစ်ခုစီသည် ခွဲခြမ်းစိတ်ဖြာမှုတွင် အညီအမျှ ပံ့ပိုးပေးစေလိုပါသည်။ ကွဲပြားမှုများကို မတူညီသောစကေးများဖြင့် တိုင်းတာသောအခါ၊ ၎င်းတို့သည် ခွဲခြမ်းစိတ်ဖြာမှုတွင် တူညီစွာ မပါဝင်နိုင်ပေ။ ဥပမာအားဖြင့်၊...

Anova တွင် f တန်ဖိုးနှင့် p တန်ဖိုးကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုမည်နည်း။

ANOVA (“ ကွဲလွဲမှုကို ခွဲခြမ်းစိတ်ဖြာခြင်း” ) ကို သုံးသော သို့မဟုတ် ထို့ထက်မကသော သီးခြားအုပ်စုများ၏ အဓိပ္ပါယ်မှာ ညီတူညီမျှရှိ၊ မရှိ ဆုံးဖြတ်ရန် အသုံးပြုသည်။ ANOVA သည် အောက်ပါ null နှင့် အခြားအခြားသော အယူအဆများကို အသုံးပြုသည် ။ H 0 : အုပ်စုဟူသည် အားလုံး ညီတူညီမျှဖြစ်သည်။ H A : အနည်းဆုံးအုပ်စုတစ်ခု၏ပျမ်းမျှသည် အခြားအုပ်စုများနှင့်မတူပါ။ သင် ANOVA ကိုလုပ်ဆောင်သည့်အခါတိုင်း၊ သင်သည် အောက်ပါပုံသဏ္ဍာန်ရှိသော အကျဉ်းချုပ်ဇယားတစ်ခုဖြင့်...

Excel တွင် manhattan အကွာအဝေးကိုဘယ်လိုတွက်ချက်မလဲ။

Vector နှစ်ခု A နှင့် B ကြားရှိ Manhattan အကွာအဝေး ကို အောက်ပါအတိုင်း တွက်ချက်သည်- Σ|A i – B i | i သည် vector တစ်ခုစီ၏ i th element ဖြစ်သည်။ ဤအကွာအဝေးကို vector နှစ်ခုကြားရှိ ကွဲပြားမှုကို တိုင်းတာရန် အသုံးပြုပြီး machine learning algorithms အများအပြားတွင် အသုံးများသည်။ အောက်ဖော်ပြပါ ဥပမာသည် Excel ရှိ vector...

R တွင် clustered standard deviation ကို တွက်နည်း

ပေါင်းစည်းထားသော စံသွေဖည်မှုသည် အမှီအခိုကင်းသော အုပ်စုနှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော အုပ်စုများ၏ စံသွေဖည်မှုများ၏ အလေးချိန်ပျမ်းမျှတစ်ခုဖြစ်သည်။ စာရင်းဇယားများတွင်၊ ၎င်းသည် လူနှစ်ဦး၏နည်းလမ်းများ ညီမျှခြင်းရှိ၊ မရှိ စမ်းသပ်ရန်အသုံးပြုသည့် နမူနာနှစ်ခု t-test တွင် အများဆုံးတွေ့ရသည်။ အုပ်စုနှစ်စုအတွက် အစုလိုက်အပြုံလိုက်စံသွေဖည်မှုကို တွက်ချက်ရန်အတွက် ဖော်မြူလာမှာ- စုပေါင်းစံသွေဖည် = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n...