Category: လမ်းညွှန်
ဂဏန်းငါးလုံးအနှစ်ချုပ် သည် အောက်ပါတန်ဖိုးငါးခုကို အသုံးပြု၍ ဒေတာအစုတစ်စုကို အကျဉ်းချုပ်ဖော်ပြသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။ အနိမ့်ဆုံး ပထမလေးပုံတစ်ပုံ ပျမ်းမျှ တတိယလေးပုံတစ်ပုံ အများဆုံး ဂဏန်းငါးလုံးအကျဉ်းချုပ်သည် ဒေတာဖြန့်ဝေမှု၏ အကျဉ်းချုပ်ကို အောက်ပါအတိုင်း ပံ့ပိုးပေးသောကြောင့် အသုံးဝင်ပါသည်။ ၎င်းသည် မီဒီယမ်ကို အသုံးပြု၍ အလယ်တန်းတန်ဖိုးသည် မည်သည့်နေရာတွင် ရှိနေသည်ကို ပြောပြသည်။ ပထမနှင့်တတိယ quartiles ကိုအသုံးပြု၍ ဒေတာ ဖြန့်ဝေမှုကို ပြောပြသည် ။ ၎င်းသည် အနိမ့်ဆုံးနှင့် အမြင့်ဆုံးကို အသုံးပြု၍ ဒေတာ၏ အကွာအဝေးကို ပြောပြသည်။ ဤတန်ဖိုးငါးခုကို သိရုံမျှဖြင့် ဒေတာအစုတစ်ခုအကြောင်း...
အကွက် ကွက်ကွက် သည် ဒေတာအတွဲတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို မြင်သာစေရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် ဇယားအမျိုးအစားတစ်ခုဖြစ်ပြီး၊ ၎င်းပါဝင်သည်- အနိမ့်ဆုံး ပထမလေးပုံတစ်ပုံ ပျမ်းမျှ တတိယလေးပုံတစ်ပုံ အများဆုံး ဤသင်ခန်းစာတွင် Google Sheets တွင် အကွက်ကွက်ကွက်ဖန်တီးနည်းကို ရှင်းပြထားသည်။ ဥပမာ- Google Sheets ရှိ Boxplots Google Sheets တွင် အကွက်ကွက်ကွက်ဖန်တီးရန် အောက်ပါအဆင့်များကို လိုက်နာပါ။ အဆင့် 1: ဒေတာကိုထည့်ပါ။ ပထမဦးစွာ သင့်ဒေတာအတွဲအတွက် တန်ဖိုးများကို ကော်လံတစ်ခုတွင် ထည့်သွင်းပါ- အဆင့် 2-...
interquartile range ကို မကြာခဏ IQR ဟုခေါ်သည်၊ သည် data set တစ်ခု၏ 50% အလယ်တန်းခွဲဝေမှုကို တိုင်းတာသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။ ဒေတာအစုတစ်ခု၏ ပထမ quartile (Q1) နှင့် တတိယ quartile (Q3) အကြား ကွာခြားချက်အဖြစ် တွက်ချက်သည်။ Quartiles များသည် data set တစ်ခုကို လေးပိုင်းခွဲ၍ တူညီသောတန်ဖိုးများဖြစ်ကြောင်း သတိပြုပါ။ IQR သည် outliers များကိုခံနိုင်ရည် ရှိသည်ဟုသိသောကြောင့် data set တစ်ခုတွင်တန်ဖိုးများဖြန့်ဝေမှုကိုတိုင်းတာရန်မကြာခဏအသုံးပြုသည်။ ၎င်းသည်...
ဒေတာအတွဲတစ်ခု၏ အလယ်အလတ်အပိုင်း ကို အောက်ပါအတိုင်း တွက်ချက်သည်။ အလယ်အလတ်တန်းစား = (အကြီးဆုံးတန်ဖိုး + အသေးဆုံးတန်ဖိုး) / ၂ ဤတန်ဖိုးသည် ဒေတာအတွဲအတွင်း အကြီးဆုံးနှင့် အသေးငယ်ဆုံးတန်ဖိုးများ၏ ပျမ်းမျှဖြစ်ပြီး ၎င်းသည် ကျွန်ုပ်တို့အား ဒေတာအတွဲတစ်ခု၏ အလယ်ဗဟိုဖြစ်သည်ကို စိတ်ကူးတစ်ခုပေးသည်။ ဤသင်ခန်းစာသည် Google Sheets ရှိ ဒေတာအစုတစ်ခု၏ အလယ်အလတ်အပိုင်းကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။ ဥပမာ- Google Sheets တွင် အလယ်အလတ်တန်းစား တွက်ချက်နည်း Google Sheets တွင် အောက်ပါဒေတာအစုံရှိသည် ဆိုကြပါစို့။...
ကွဲလွဲမှု၏ coefficient သည် CV တွင် အတိုကောက်အတိုကောက်ခေါ်လေ့ရှိပြီး ဆိုသည်မှာ ပျမ်းမျှနှင့် သက်ဆိုင်သော data set တစ်ခုတွင် တန်ဖိုးများပျံ့နှံ့မှုကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ CV = σ / µ ရွှေ- σ- ဒေတာအတွဲ၏ စံသွေဖည်မှု μ: ဒေတာအစုံ၏ပျမ်းမျှ ရိုးရိုးရှင်းရှင်းပြောရလျှင် ကွဲလွဲမှု၏ coefficient သည် စံသွေဖည်မှု၏ ပျမ်းမျှအချိုးဖြစ်သည်။ ကွဲလွဲမှု၏ coefficient ကို ဘယ်အချိန်မှာ သုံးမလဲ။ မတူညီသောဒေတာအတွဲနှစ်ခုကြား ကွဲလွဲမှုကို နှိုင်းယှဉ်ရန်...
Mean absolute deviation သည် data values အစုအဝေး၏ ကွဲလွဲမှုကို တိုင်းတာသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ ဆိုလိုရင်းအကြွင်းမဲ့သွေဖည်မှုအတွက် နိမ့်သောတန်ဖိုးသည် ဒေတာတန်ဖိုးများကို တင်းတင်းကျပ်ကျပ် စုစည်းထားကြောင်း ဖော်ပြသည်။ ဆိုလိုရင်းအကြွင်းမဲ့သွေဖည်မှုအတွက် မြင့်မားသောတန်ဖိုးသည် ဒေတာတန်ဖိုးများ ပိုမိုပြန့်ကျဲနေကြောင်း ညွှန်ပြသည်။ ပျမ်းမျှအကြွင်းမဲ့သွေဖည်မှုကို တွက်ချက်ရန် ဖော်မြူလာမှာ- ပျမ်းမျှ ပကတိသွေဖည်မှု = (Σ |x i – x |) / n ∑ – “ ပေါင်း” ဟု အဓိပ္ပါယ်ရသော...
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ လွဲမှားမှု နှင့် kurtosis သည် ဖြန့်ဖြူးမှုပုံသဏ္ဍာန်ကို တိုင်းတာသည့် နည်းလမ်းနှစ်သွယ်ဖြစ်သည်။ Skewness သည် ဖြန့်ဝေမှုတစ်ခု၏ ပေါ့ပါးမှု၏ အတိုင်းအတာတစ်ခုဖြစ်သည်။ ဤတန်ဖိုးသည် အပေါင်း သို့မဟုတ် အနုတ်လက္ခဏာ ဖြစ်နိုင်သည်။ အနုတ်လက္ခဏာ လွဲချော်နေခြင်းက အမြီးသည် ဖြန့်ဖြူးမှု၏ ဘယ်ဘက်ခြမ်းတွင် ရှိနေကြောင်း ညွှန်ပြသည်၊ ၎င်းသည် ပို၍ အနုတ်လက္ခဏာတန်ဖိုးများဆီသို့ တိုးသွားပါသည်။ အပြုသဘောဆောင်သော လှည့်ကွက်သည် အမြီးသည် ဖြန့်ဖြူးမှု၏ ညာဘက်ခြမ်းတွင် ရှိနေကြောင်း ညွှန်ပြသည်၊ ၎င်းသည် ပိုမိုအပြုသဘောဆောင်သော တန်ဖိုးများဆီသို့ တိုးသွားပါသည်။ သုည၏တန်ဖိုးသည်...
ပျမ်းမျှအမှား သည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများ ဖြန့်ဖြူးမှုကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ စံအမှား = s / √n ရွှေ- s : နမူနာစံသွေဖည် n : နမူနာအရွယ်အစား ဤသင်ခန်းစာတွင် R တွင်သတ်မှတ်ထားသောဒေတာ၏စံအမှားကိုတွက်ချက်ရန် သင်အသုံးပြုနိုင်သည့်နည်းလမ်းနှစ်ခုကို ရှင်းပြထားသည်။ နည်းလမ်း 1- Plotrix စာကြည့်တိုက်ကို အသုံးပြုပါ။ ဆိုလိုရင်း၏ စံအမှားကို တွက်ချက်ရန် ပထမဆုံးနည်းလမ်းမှာ Plotrix စာကြည့်တိုက်၏ built-in std.error() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။ အောက်ပါကုဒ်သည်...
R တွင် linear regression model နှင့် ကိုက်ညီသည့်အခါတိုင်း၊ model သည် အောက်ပါပုံစံကို ယူသည်- Y = β 0 + β 1 X + … + β i ϵ သည် X နှင့် ကင်းသော အမှားအယွင်းတစ်ခုဖြစ်သည်။ Y ၏တန်ဖိုးများကိုခန့်မှန်းရန် X ကိုမည်မျှအသုံးပြုနိုင်ပါစေ၊ မော်ဒယ်တွင်ကျပန်းအမှားအမြဲရှိလိမ့်မည်။ ဤကျပန်းအမှား၏ပျံ့နှံ့မှုကိုတိုင်းတာရန်နည်းလမ်းတစ်ခုမှာ ကျန်ရှိသောစံလွဲချော်မှုကို ϵ တိုင်းတာခြင်းနည်းလမ်းဖြစ်သည့် ကျန်ရှိသောစံအမှားကို အသုံးပြုခြင်းဖြစ်သည်။...
ပျမ်းမျှအမှားသည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဖြူးမှုကို တိုင်းတာသည့်နည်းလမ်းဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ ဆိုလိုတာ = s / √n ၏ စံအမှား ရွှေ- s : နမူနာစံသွေဖည် n : နမူနာအရွယ်အစား ဤသင်ခန်းစာတွင် Python ရှိ ဒေတာသတ်မှတ်မှု၏ပျမ်းမျှအမှားကို တွက်ချက်ရန် သင်အသုံးပြုနိုင်သည့် နည်းလမ်းနှစ်ခုကို ရှင်းပြထားသည်။ နည်းလမ်းနှစ်ခုလုံးသည် အတိအကျတူညီသောရလဒ်များထွက်သည်ကို သတိပြုပါ။ နည်းလမ်း 1- SciPy ကိုသုံးပါ။ Mean ၏ စံအမှားကို တွက်ချက်ရန် ပထမဆုံးနည်းလမ်းမှာ SciPy...