အုပ်စုဖွဲ့ဒေတာ

ဤဆောင်းပါးတွင် ဒေတာအုပ်စုဖွဲ့ပုံနှင့် ဒေတာအုပ်စုဖွဲ့ပုံတို့ကို ရှင်းပြထားသည်။ ထို့အပြင်၊ ဒေတာကို ကြားကာလအလိုက် အုပ်စုဖွဲ့ထားသည့် ဖြေရှင်းထားသော လေ့ကျင့်ခန်းကို သင်တွေ့လိမ့်မည်။

အုပ်စုဖွဲ့ဒေတာဟူသည် အဘယ်နည်း။

စာရင်းဇယားများတွင် binded data သည် ကြားကာလများအဖြစ် အုပ်စုဖွဲ့ထားသော ဒေတာဖြစ်သည်။ တစ်နည်းဆိုရသော် အုပ်စုဖွဲ့ထားသော ဒေတာသည် ၎င်းတို့ကို အတူတကွ လေ့လာနိုင်စေရန် ပုံမှန်ကြားကာလတွင် စုဆောင်းထားသော ဒေတာဖြစ်သည်။

ထို့ကြောင့်၊ ကိန်းဂဏန်းအချက်အလက်အစုအဝေးကို အုပ်စုဖွဲ့သည့်အခါ၊ ဒေတာအပိုင်းတစ်ခုစီသည် ကြားကာလတစ်ခုသာရှိနိုင်စေရန် မတူညီသောကာလများအဖြစ် ခွဲခြားထားသည်။

အတိုချုပ်ပြောရလျှင် ကိန်းဂဏန်းအချက်အလက်များကို အစုလိုက်ဖွဲ့ခြင်းသည် ဒေတာအများအပြားကို ပူးတွဲခွဲခြမ်းစိတ်ဖြာနိုင်စေသောကြောင့် ကြားကာလတစ်ခုအတွင်း အုပ်စုဖွဲ့ထားသော ဒေတာကို ဒေတာအပိုင်းအစတစ်ခုအဖြစ် မှတ်ယူနိုင်စေပါသည်။ ထို့အပြင် နမူနာသည် အလွန်ကြီးမားသောအခါတွင် ဒေတာပေါင်းစည်းခြင်းသည် အလွန်အသုံးဝင်ပါသည်။

အုပ်စုဖွဲ့ဒေတာ နမူနာ

အုပ်စုဖွဲ့ထားသောဒေတာ၏ အဓိပ္ပါယ်ဖွင့်ဆိုချက်ကိုကြည့်ပါ၊ အောက်တွင်ဖော်ပြထားသည်မှာ ဒေတာအစုတစ်စုအား မတူညီသောအချိန်အပိုင်းအခြားများအဖြစ် အုပ်စုဖွဲ့ပုံ၏ ခိုင်မာသောဥပမာတစ်ခုဖြစ်သည်။

  • မတူညီသောလူ 50 ၏နမူနာအရွယ်အစားကို တိုင်းတာခဲ့ပြီး တန်ဖိုးအားလုံးကို အောက်ပါဒေတာဇယားတွင် မှတ်တမ်းတင်ခဲ့သည်။ သတ်မှတ်ဒေတာကို ကြားကာလများအဖြစ် အုပ်စုဖွဲ့ပြီး ဒေတာကို ဂရပ်ဖစ်လုပ်ပါ။

ပထမဦးစွာ၊ ကျွန်ုပ်တို့သည် data များကိုကြားကာလများအဖြစ်ခွဲခြားရန်လိုအပ်သည်။ ၎င်းအတွက် နည်းလမ်းများစွာရှိသော်လည်း Sturges ၏စည်းမျဉ်းသည် သင့်အား အကောင်းဆုံးအချိန်ကာလများကို တွက်ချက်နိုင်သောကြောင့် ၎င်းသည် အသုံးအများဆုံးဖြစ်သည်၊

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(50)\\[2ex]c=1+5,64\\[2ex]c=6,64\\[2ex]c\approx 7\end{array}

ဒါကြောင့် ဒေတာကို ကွဲပြားတဲ့ ကြားကာလ ခုနစ်ခုအဖြစ် ခွဲခြားထားဖို့ လိုပါတယ်။ ကြားကာလတစ်ခုစီတွင်ရှိရမည့် အကျယ်ကို ယခုကျွန်ုပ်တို့သိရန်လိုအပ်ပါသည်။ ၎င်းကိုလုပ်ဆောင်ရန်၊ အမြင့်ဆုံးတန်ဖိုးကို အနိမ့်ဆုံးတန်ဖိုးကို ကြားကာလစုစုပေါင်းအရေအတွက်ဖြင့် ပိုင်းခြားပါ။

a=\cfrac{\text{valor m\'aximo}-\text{valor m\'inimo}}{c}=\cfrac{205-145}{7}=8,57\approx 9

အတိုချုပ်အားဖြင့်၊ amplitude 9 ၏ ကြားကာလ 7 ခု ရှိရမည်၊ ထို့ကြောင့် Sturges ၏ စည်းမျဉ်းအရ တွက်ချက်ထားသော ကြားကာလများမှာ အောက်ပါအတိုင်း ဖြစ်သည်။

[145,154)

[154,163)

[163,172)

[172,181)

[181,190)

[190,199)

[199,208)

ကြားကာလများကို ကျွန်ုပ်တို့တွက်ချက်ပြီးသည်နှင့်၊ ကြားကာလတစ်ခုစီတွင် ဒေတာအပိုင်းတစ်ခုပေါ်လာသည့် အကြိမ်အရေအတွက်ကို ရေတွက်ပြီး အုပ်စုဖွဲ့ထားသောဒေတာဖြင့် ဇယားတစ်ခုကို တည်ဆောက်ပါသည်။

အုပ်စုဖွဲ့ဒေတာ (နှိုင်းရကြိမ်နှုန်း၊ စုဆောင်းမှုအကြိမ်ရေ စသည်) မှ ပိုမိုသော ကြိမ်နှုန်းအမျိုးအစားများကို တွက်ချက်နိုင်ကြောင်း မှတ်သားထားပါ။ အုပ်စုဖွဲ့ဒေတာဖြင့် ပြီးပြည့်စုံသော ကြိမ်နှုန်းဇယားကို ဖန်တီးနည်းကို ကြည့်ရှုရန်၊ ဤနေရာကို နှိပ်ပါ-

နောက်ဆုံးတွင်၊ ကြားကာလတစ်ခုစီ၏ ကြိမ်နှုန်းဖြင့် ဇယားမှ ဒေတာကို ဟီစတိုဂရမ်အဖြစ် အုပ်စုဖွဲ့ထားသော ဂရပ်ဖစ်နိုင်သည်။

Sturges သည် histogram၊ စာရင်းအင်းများကို အုပ်ချုပ်သည်။
ကြည့်ပါ- histogram လုပ်နည်း

အုပ်စုဖွဲ့ပြီး အုပ်စုမဖွဲ့ထားသောဒေတာ

Ungrouped data သည် အချိန်ပိုင်းခြား၍မထားသော ဒေတာဖြစ်ပြီး တန်ဖိုးတစ်ခုစီကို သီးခြားစီလေ့လာသည်။

အထက်ဖော်ပြပါ ဥပမာအတိုင်း လုပ်ဆောင်ပြီးနောက်၊ ကျွန်ုပ်တို့သည် ဒေတာများကို အုပ်စုဖွဲ့မထားပါက၊ ကျွန်ုပ်တို့သည် တန်ဖိုးတစ်ခုစီ၏ ကြိမ်နှုန်းကို ရှာဖွေရမည်ဖြစ်ပါသည်။ ဆိုလိုသည်မှာ၊ ကျွန်ုပ်တို့သည် တန်ဖိုး 158၊ 165၊ 174 စသည်တို့ကို အဆမည်မျှ တွက်ချက်သင့်သည်။ ထပ်ခါထပ်ခါ။ သို့သော်၊ ဤကိစ္စတွင်၊ ကျွန်ုပ်တို့တွင် ဒေတာပမာဏများပြားပြီး တန်ဖိုးများစွာသည် အလားတူဖြစ်သောကြောင့် ဒေတာများကို ကြားကာလအလိုက် အုပ်စုဖွဲ့ခြင်းက ပိုကောင်းပါသည်။

ထို့ကြောင့်၊ ကိန်းဂဏန်းလေ့လာမှုတစ်ခုအတွင်း၊ တွက်ချက်မှုများမလုပ်ဆောင်မီ၊ ဒေတာများကို ကြားကာလအလိုက် အုပ်စုဖွဲ့သင့်သည်ဖြစ်စေ မဆုံးဖြတ်ရန် အရေးကြီးသောကြောင့်၊ ၎င်းသည် စုံစမ်းမှု၏ကျန်ရှိသောအခြေအနေဖြစ်မည်ဖြစ်သောကြောင့်၊

ဘယ်အချိန်မှာ Data တွေကို စုစည်းသင့်လဲ။

ယေဘုယျအားဖြင့်၊ ကိန်းရှင်သည် ဆက်တိုက်ဖြစ်နေသောအခါ ဒေတာကို ကြားကာလများအဖြစ် အုပ်စုဖွဲ့သင့်သည်။ ကိန်းရှင်သည် စဉ်ဆက်မပြတ်ဖြစ်နေပါက၊ ကျွန်ုပ်တို့တွင် ပုံမှန်အားဖြင့် တန်ဖိုးများစွာရှိပြီး ၎င်းတို့သည် တစ်ခုနှင့်တစ်ခု အလွန်နီးကပ်နေသောကြောင့် ၎င်းတို့ကို လေ့လာမှုကို ရိုးရှင်းစေရန် ကြားကာလများအဖြစ် အုပ်စုဖွဲ့နိုင်သည်။

ယုတ္တိဗေဒအရ၊ ကိန်းရှင်သည် အဆက်မပြတ်ဖြစ်နေလျှင်ပင်၊ ကျွန်ုပ်တို့တွင် ဒေတာများစွာရှိပါက၊ ၎င်းကို ကြားကာလများအဖြစ် အုပ်စုဖွဲ့နိုင်ပြီး စာရင်းအင်းခွဲခြမ်းစိတ်ဖြာမှုကို ပိုမိုလွယ်ကူစေသည်။ သို့သော် ယေဘုယျအားဖြင့် ဒေတာအုပ်စုဖွဲ့ခြင်းဆိုင်ရာ စံသတ်မှတ်ချက်မှာ ကိန်းရှင်အမျိုးအစားဖြစ်သည်- အကယ်၍ ကိန်းရှင်သည် စဉ်ဆက်မပြတ်ဖြစ်နေပါက၊ ဒေတာကို ယေဘုယျအားဖြင့် ကြားကာလအဖြစ် ခွဲခြားထားသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်