Category: လမ်းညွှန်
ဖြစ်နိုင်ခြေ ဖြန့်ဝေမှုသည် အချို့သောတန်ဖိုးများပေါ်တွင် ကျပန်းပြောင်းလွဲချက် တစ်ခုက ဖြစ်နိုင်ခြေကို ပြောပြသည်။ ဥပမာအားဖြင့်၊ အောက်ပါဖြစ်နိုင်ခြေဖြန့်ဝေမှုသည် သတ်မှတ်ထားသောပွဲစဉ်တစ်ခုတွင် ဘောလုံးအသင်းတစ်သင်းမှ အချို့သောဂိုးအရေအတွက်ကို သွင်းယူနိုင်ခြေကို ပြောပြသည်- ဖြစ်နိုင်ခြေဖြန့်ဝေမှု၏ ကွဲလွဲမှုကို ရှာဖွေရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါဖော်မြူလာကို အသုံးပြုနိုင်ပါသည်။ σ 2 = Σ(x i -μ) 2 * P(x i ) ရွှေ- x i : ith တန်ဖိုး μ: ဖြန့်ဖြူးမှု၏ ဆိုလိုရင်း P(x...
အကြွင်းအကျန်များနှင့် သုံးစွဲနိုင်မှုပမာဏသည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် သြဇာကြီးမားသော စောင့်ကြည့်မှုများကို ဖော်ထုတ်နိုင်စေမည့် ရောဂါရှာဖွေရေးဇယား အမျိုးအစားတစ်ခုဖြစ်သည်။ ဤအရာသည် ကိန်းဂဏန်းဆိုင်ရာ ပရိုဂရမ်းမင်းဘာသာစကား R တွင် ဤကွက်ကွက်အမျိုးအစား ပေါ်လာပုံဖြစ်သည်- ဒေတာအတွဲရှိ စောင့်ကြည့်မှုတစ်ခုစီကို ကွက်ကွက်အတွင်းရှိ အမှတ်တစ်ခုတည်းအဖြစ် ပြသထားသည်။ x-axis သည် အမှတ်တစ်ခုစီ၏ လွှမ်းမိုးမှုကို ပြသပြီး y-axis သည် အမှတ်တစ်ခုစီ၏ စံသတ်မှတ်ထားသော ကျန်ရှိနေမှုကို ပြသသည်။ Leverage သည် ဒေတာအတွဲမှ သတိပြုစရာတစ်ခုကို ဖယ်ရှားလိုက်လျှင် ဆုတ်ယုတ်မှုပုံစံ၏ ကိန်းဂဏန်းများ ပြောင်းလဲသွားမည့်အတိုင်းအတာကို ရည်ညွှန်းသည်။ မြင့်မားသော...
ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအစုံရှိ အသေးငယ်ဆုံးနှင့် အကြီးဆုံးတန်ဖိုးများ၏ တိကျသောရာခိုင်နှုန်းကို ဖယ်ရှားပြီးနောက် တွက်ချက်ထားသော ဒေတာအတွဲတစ်ခု၏ ပျမ်းမျှဖြစ်သည်။ ဖြတ်တောက်ထားသော X% ကို တွက်ချက်ရန် ဤအဆင့်များကို လိုက်နာနိုင်သည်- အဆင့် 1- ဒေတာအတွဲတစ်ခုရှိ တန်ဖိုးတစ်ခုစီကို အသေးငယ်ဆုံးမှ အကြီးဆုံးသို့ မှာယူပါ။ အဆင့် 2- ဒေတာအတွဲ၏ အောက်ခြေ X% နှင့် ထိပ် X% ရှိ တန်ဖိုးများကို ဖယ်ရှားပါ။ အဆင့် 3 : ကျန်တန်ဖိုးများ၏ ပျမ်းမျှကို တွက်ချက်ပါ။ အောက်ဖော်ပြပါ...
ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအစုံရှိ အသေးငယ်ဆုံးနှင့် အကြီးဆုံးတန်ဖိုးများ၏ တိကျသောရာခိုင်နှုန်းကို ဖယ်ရှားပြီးနောက် တွက်ချက်ထားသော ဒေတာအတွဲတစ်ခု၏ ပျမ်းမျှဖြစ်သည်။ Python တွင် ဖြတ်တောက်ထားသော ဆိုလိုချက်ကို တွက်ချက်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ SciPy စာကြည့်တိုက်မှ trim_mean() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။ ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်- from scipy import stats #calculate 10% trimmed mean stats. trim_mean (data, 0.1 ) အောက်ဖော်ပြပါ ဥပမာများသည် လက်တွေ့တွင်...
Variance သည် data set တစ်ခုတွင် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။ လူဦးရေကွဲလွဲမှုကို တွက်ချက်ရန် ဖော်မြူလာမှာ- σ 2 = Σ (x i – μ) 2 / N ရွှေ- ∑ : “ပေါင်း” ဟူသော သင်္ကေတ၊ μ : လူဦးရေ ပျမ်းမျှ x i : လူဦးရေ၏ i th ဒြပ်စင် N...
Variance သည် data set တစ်ခုတွင် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။ လူဦးရေကွဲလွဲမှုကို တွက်ချက်ရန် ဖော်မြူလာမှာ- σ 2 = Σ (x i – μ) 2 / N ရွှေ- ∑ : “ပေါင်း” ဟူသော သင်္ကေတ၊ μ : လူဦးရေ ပျမ်းမျှ x i : လူဦးရေ၏ i th ဒြပ်စင် N...
ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအစုံရှိ အသေးငယ်ဆုံးနှင့် အကြီးဆုံးတန်ဖိုးများ၏ တိကျသောရာခိုင်နှုန်းကို ဖယ်ရှားပြီးနောက် တွက်ချက်ထားသော ဒေတာအတွဲတစ်ခု၏ ပျမ်းမျှဖြစ်သည်။ ဥပမာအားဖြင့်၊ 10% ဖြတ်တောက်ထားသော ဆိုလိုချက်သည် တန်ဖိုးများ၏ အသေးငယ်ဆုံး 10% နှင့် တန်ဖိုးများ၏ အကြီးဆုံး 10% ကို ဖယ်ရှားပြီးနောက် ဒေတာအစုတစ်ခု၏ ပျမ်းမျှအား ကိုယ်စားပြုမည်ဖြစ်သည်။ R တွင် ဖြတ်တောက်ထားသော ဆိုလိုရင်းကို တွက်ချက်ရန် အရိုးရှင်းဆုံးနည်းလမ်းမှာ အောက်ပါ အခြေခံ syntax ကို အသုံးပြုခြင်းဖြစ်သည် ။ #calculate 10% trimmed...
ပျမ်းမျှ၊ အလယ်အလတ်၊ ပေါင်းလဒ်၊ စံသွေဖည်မှု စသည်ဖြင့် တွက်ချက်ရန် အောက်ပါ အခြေခံ syntax ကို သင်သုံးနိုင်သည်။ #N/A တန်ဖိုးများကို လျစ်လျူရှုနေစဉ် Excel တွင်- =AVERAGE(IFNA( A2:A21 , "")) =MEDIAN(IFNA( A2:A21 , "")) =SUM(IFNA( A2:A21 , "")) =STDEV(IFNA( A2:A21 , "")) ဤ syntax သည် #N/A တန်ဖိုးများကို space များဖြင့် အစားထိုးပြီး သင်စိတ်ဝင်စားသော...
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ ယုံကြည်မှုကြားကာလ သည် ယုံကြည်စိတ်ချရမှုအဆင့်တစ်ခုရှိ သည့် လူဦးရေကန့်သတ်ချက် ပါ၀င်နိုင်ခြေရှိသော တန်ဖိုးများအကွာအဝေးတစ်ခုဖြစ်သည်။ လူဦးရေနှစ်ခုကြားခြားနားချက်အတွက် ယုံကြည်မှုကြားကာလ တစ်ခုကို တွက်ချက်ပြီး ယုံကြည်မှုကြားကာလသည် သုညတန်ဖိုးပါရှိသည်ကို တွေ့ရှိပါက၊ ဆိုလိုသည်မှာ လူဦးရေနှစ်ခုကြားရှိ စစ်မှန်သောခြားနားချက်အတွက် ကျိုးကြောင်းဆီလျော်သောတန်ဖိုးတစ်ခုဟု ကျွန်ုပ်တို့ထင်မြင်ပါသည်။ တစ်နည်းဆိုရသော် ယုံကြည်မှုကြားကာလတွင် သုညပါ၀င်ပါက၊ လူဦးရေနှစ်ခု၏နည်းလမ်းများအကြား “ သိသာထင်ရှားသော” ကွာခြားမှုမရှိကြောင်း ခိုင်လုံသောအထောက်အထားရှိသည်ဟု ကျွန်ုပ်တို့ပြောနိုင်သည်။ အောက်ဖော်ပြပါဥပမာများသည် တန်ဖိုးသုညနှင့်မပါဘဲ ယုံကြည်မှုကြားကာလများကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်ကို ရှင်းပြထားသည်။ ဥပမာ 1- ယုံကြည်မှုကြားကာလသည် သုညပါရှိသည်။ ဇီဝဗေဒပညာရှင်တစ်ဦးသည် မတူညီသောလိပ်မျိုးစိတ်နှစ်ခုကြားရှိ ပျမ်းမျှအလေးချိန်ကွာခြားချက်ကို...
ကျောင်းသားတွေ မေးလေ့ရှိတဲ့ မေးခွန်းတစ်ခုကတော့ t-test ပြုလုပ်ရန် အနည်းဆုံးနမူနာအရွယ်အစား လိုအပ်ပါသလား။ အတိုကောက် အဖြေ- နံပါတ်။ t-test ပြုလုပ်ရန် အနည်းဆုံးနမူနာအရွယ်အစား မလိုအပ်ပါ။ တကယ်တော့ ပထမအကြိမ် t-test ကို လူလေးယောက်သာ နမူနာ အသုံးပြုခဲ့ပါတယ်။ သို့သော် t-test ၏ ယူဆချက်များနှင့် မကိုက်ညီပါက ရလဒ်များသည် ယုံကြည်စိတ်ချရမည်မဟုတ်ပေ။ ထို့အပြင်၊ နမူနာအရွယ်အစားသည် အလွန်သေးငယ်ပါက၊ ဒေတာတွင် သိသာထင်ရှားသော ကွဲပြားမှုများကို သိရှိနိုင်စေရန် စမ်းသပ်မှု၏ ပါဝါသည် အလွန်နည်းပါးနေပေမည်။ ဒီဖြစ်နိုင်ချေရှိတဲ့ ပြဿနာတစ်ခုချင်းစီကို ပိုပြီးအသေးစိတ်ကြည့်ရအောင်။...