ဒေတာအကြမ်းကို ဘယ်အရာက ယူဆသလဲ။ (အဓိပ္ပါယ်နှင့် ဥပမာများ)
စာရင်းဇယားများတွင်၊ ကုန်ကြမ်းဒေတာ သည် မူလရင်းမြစ်တစ်ခုမှ တိုက်ရိုက်စုဆောင်းပြီး မည်သည့်နည်းဖြင့်မျှ မလုပ်ဆောင်ရသေးသည့် ဒေတာကို ရည်ညွှန်းသည်။
မည်သည့်ဒေတာခွဲခြမ်းစိတ်ဖြာမှုပရောဂျက်အမျိုးအစားတွင်မဆို ပထမအဆင့်မှာ ဒေတာအကြမ်းစုဆောင်းရန်ဖြစ်သည်။ ဤဒေတာကို စုဆောင်းပြီးသည်နှင့် ၎င်းကို ရှင်းလင်းခြင်း၊ အသွင်ပြောင်းခြင်း၊ အကျဉ်းချုံးပြီး မြင်ယောင်နိုင်မည်ဖြစ်သည်။
ဒေတာအကြမ်းစုဆောင်းခြင်း၏ အားသာချက်မှာ အချို့သောဖြစ်စဉ်များကို ပိုမိုကောင်းမွန်စွာနားလည်ရန် သို့မဟုတ် ကြိုတင်ခန့်မှန်းမှုပုံစံတစ်ခုတည်ဆောက်ရန် ၎င်းကိုအသုံးပြုရန် နောက်ဆုံးတွင် ၎င်းကိုအသုံးပြုရန်ဖြစ်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် ဒေတာအကြမ်းများကို စုဆောင်းပြီး လက်တွေ့ဘဝတွင် မည်ကဲ့သို့ အသုံးပြုနိုင်ကြောင်း ဖော်ပြသည်။
ဥပမာ- ဒေတာအကြမ်းစုဆောင်းခြင်းနှင့် အသုံးပြုခြင်း။
အားကစားသည် ဒေတာအကြမ်းများကို မကြာခဏ စုဆောင်းသည့် နေရာတစ်ခုဖြစ်သည်။ ဥပမာအားဖြင့်၊ ပရော်ဖက်ရှင်နယ်ဘတ်စကတ်ဘောကစားသမားများနှင့်ပတ်သက်သည့် ကိန်းဂဏန်းအမျိုးမျိုးအတွက် အကြမ်းထည်ဒေတာကို စုဆောင်းနိုင်သည်။
အဆင့် 1: ဒေတာအကြမ်းစုဆောင်းပါ။
ဘတ်စကက်ဘောကင်းထောက်တစ်ဦးသည် ပရော်ဖက်ရှင်နယ်ဘတ်စကတ်ဘောအသင်းတွင် ကစားသမား 10 ဦးအတွက် အောက်ပါအကြမ်းထည်အချက်အလက်များကို စုဆောင်းနေသည်ဟု မြင်ယောင်ကြည့်ပါ-
ဤဒေတာအတွဲသည် ကင်းထောက်မှ တိုက်ရိုက်စုဆောင်းထားသောကြောင့် ဒေတာအကြမ်းကို ကိုယ်စားပြုပြီး မည်သည့်နည်းဖြင့်မျှ သန့်စင်ခြင်း သို့မဟုတ် လုပ်ဆောင်ခြင်းမရှိပါ။
အဆင့် 2: ဒေတာအကြမ်းကို သန့်ရှင်းပါ။
အနှစ်ချုပ်ဇယားများ၊ ဂရပ်များ သို့မဟုတ် အခြားအရာများကို ဖန်တီးရန် ဤဒေတာကို အသုံးမပြုမီ၊ ကင်းထောက်သည် ပျောက်ဆုံးနေသော တန်ဖိုးများကို ဦးစွာဖယ်ရှားပြီး “ ညစ်ပတ်သော” ဒေတာတန်ဖိုးများကို ရှင်းပစ်ရပါမည်။
ဥပမာအားဖြင့်၊ အသွင်ပြောင်းရန် သို့မဟုတ် ဖယ်ရှားရန် လိုအပ်သည့် ဒေတာအတွဲတွင် တန်ဖိုးများစွာကို ကျွန်ုပ်တို့ တွေ့ရှိနိုင်သည်-
ကင်းထောက်သည် ပျောက်ဆုံးနေသောတန်ဖိုးများစွာရှိသောကြောင့် နောက်ဆုံးအတန်းကို လုံးလုံးဖယ်ရှားရန် ဆုံးဖြတ်နိုင်သည်။ ထို့နောက် အောက်ပါ “ သန့်ရှင်း” ဒေတာကို ရယူရန် ဒေတာအတွဲရှိ ဇာတ်ကောင်တန်ဖိုးများကို ရှင်းလင်းနိုင်သည်-
အဆင့် 3: ဒေတာကို အကျဉ်းချုံ့ပါ။
ဒေတာကို သန့်စင်ပြီးသည်နှင့် ကင်းထောက်သည် ဒေတာအတွဲရှိ ကိန်းရှင်တစ်ခုစီကို အကျဉ်းချုံးနိုင်သည်။ ဥပမာအားဖြင့်၊ ၎င်းသည် “ မိနစ်များ” variable အတွက် အောက်ပါအကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်နိုင်သည်-
- ပျမ်းမျှ : 24 မိနစ်
- ပျမ်းမျှ : 22 မိနစ်
- စံသွေဖည် : 9.45 မိနစ်
အဆင့် 4: ဒေတာကိုမြင်ယောင်ကြည့်ပါ။
ထို့နောက် ကင်းထောက်သည် ဒေတာတန်ဖိုးများကို ပိုမိုကောင်းမွန်စွာ နားလည်ရန် ဒေတာအတွဲရှိ ကိန်းရှင်များကို မြင်ယောင်နိုင်သည်။
ဥပမာအားဖြင့်၊ ကစားသမားတစ်ဦးစီမှ ကစားသည့် စုစုပေါင်း မိနစ်ကို မြင်ယောင်နိုင်ရန် အောက်ပါ ဘားဇယားကို ဖန်တီးနိုင်သည်-
သို့မဟုတ် ကစားချိန် မိနစ်နှင့် ရမှတ်များကြား ဆက်စပ်မှုကို မြင်ယောင်နိုင်ရန် အောက်ပါ အပိုင်းအစကို ဖန်တီးနိုင်သည်-
ဤဇယားအမျိုးအစားတစ်ခုစီသည် ဒေတာကို ပိုနားလည်အောင် ကူညီပေးနိုင်သည်။
အဆင့် 5: မော်ဒယ်တစ်ခုတည်ဆောက်ရန် ဒေတာကို အသုံးပြုပါ။
နောက်ဆုံးတွင်၊ ဒေတာကို သန့်စင်ပြီးသည်နှင့်၊ ကင်းထောက်သည် ခန့်မှန်းမှုပုံစံအချို့ကို လိုက်လျောညီထွေဖြစ်အောင် ဆုံးဖြတ်နိုင်သည်။
ဥပမာအားဖြင့်၊ ၎င်းသည် ရိုးရှင်းသော linear regression model နှင့် အံဝင်ခွင်ကျဖြစ်ပြီး ကစားသမားတစ်ဦးစီမှ ရမှတ်စုစုပေါင်းရမှတ်ကို ခန့်မှန်းရန် မိနစ်များကို အသုံးပြုနိုင်သည်။
တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုညီမျှခြင်းမှာ-
ရမှတ် = 8.7012 + 0.2717*(မိနစ်)
ထို့နောက် ကင်းထောက်သည် ကစားသည့် မိနစ်အရေအတွက်ပေါ်မူတည်၍ ကစားသမားတစ်ဦးဂိုးသွင်းမည့် အမှတ်အရေအတွက်ကို ခန့်မှန်းရန် ဤညီမျှခြင်းကို အသုံးပြုနိုင်သည်။ ဥပမာအားဖြင့်၊ မိနစ် 30 ကစားသော အားကစားသမားသည် ရမှတ် 16.85 ရသင့်သည်-
ရမှတ် = 8.7012 + 0.2717*(30) = 16.85
ထပ်လောင်းအရင်းအမြစ်များ
ကိန်းဂဏန်းတွေက ဘာကြောင့် အရေးကြီးတာလဲ။
စာရင်းဇယားများတွင် နမူနာအရွယ်အစားသည် အဘယ်ကြောင့်အရေးကြီးသနည်း။
စာရင်းအင်းများတွင် စောင့်ကြည့်လေ့လာခြင်းဆိုသည်မှာ အဘယ်နည်း။
ကိန်းဂဏန်းစာရင်းဇယားများတွင် ဇယားဒေတာဟူသည် အဘယ်နည်း။