Aggregation bias ဆိုတာ ဘာလဲ။ (ရှင်းလင်းချက်နှင့် ဥပမာ)
ပေါင်းစည်းထားသောဒေတာတွင် တွေ့ရှိရသော လမ်းကြောင်းများသည် ဒေတာအမှတ်တစ်ခုချင်းစီနှင့်လည်း သက်ဆိုင်သည်ဟု မှားယွင်းစွာယူဆသောအခါ စုစည်းမှုဘက်လိုက်မှု ဖြစ်ပေါ်သည်။
ဤဘက်လိုက်မှုအမျိုးအစားကို နားလည်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ ရိုးရှင်းသော ဥပမာတစ်ခုကို ယူခြင်းဖြစ်သည်။
ဥပမာ- စုစည်းမှုဘက်လိုက်မှု
သုတေသီများသည် ပျမ်းမျှနှစ်များ ပညာရေးနှင့် ပျမ်းမျှအိမ်ထောင်စုဝင်ငွေအကြား ဆက်စပ်မှုကို နားလည်လိုသည်ဆိုပါစို့။ ၎င်းတို့သည် ပြည်နယ်အတွင်းရှိ မတူညီသောမြို့ကြီး 4 ခုအတွက် စုစည်းထားသောဒေတာကို ရယူပြီး ပျမ်းမျှပညာရေးနှင့် ပျမ်းမျှအိမ်ထောင်စုဝင်ငွေအကြား ဆက်စပ်မှုကို တွက်ချက်ပါသည်။
ပျမ်းမျှပညာရေးနှစ်နှင့် ပျမ်းမျှအိမ်ထောင်စုဝင်ငွေ 0.9632 အ ကြား ဆက်စပ်မှု ရှိသည်ကို တွေ့ရပါသည်။ ၎င်းသည် အလွန်အပြုသဘောဆောင်သော ဆက်စပ်ကိန်းဖြစ်သည်။
သုတေသီများသည် ပညာရေး၏ ပျမ်းမျှနှစ်များနှင့် ပျမ်းမျှအိမ်ထောင်စုဝင်ငွေအကြား ဆက်စပ်မှုကို မြင်ယောင်နိုင်ရန် အပိုင်းအစတစ်ခုကိုပင် ဖန်တီးသည်-
တစ်ဦးချင်းအချက်အလက်ကို အမှန်တကယ်မကြည့်ဘဲ၊ နှစ်ပေါင်းများစွာ ပညာရေးသည် အိမ်ထောင်စုဝင်ငွေနှင့် ခိုင်ခိုင်မာမာ ဆက်နွှယ်နေသည်ဟု ဆိုထားသော အစီရင်ခံစာကို ထုတ်ပြန်နိုင်သည်။
သို့ရာတွင်၊ သုတေသီအသစ်သည် တစ်နှစ်အကြာတွင် ရောက်ရှိလာပြီး တူညီသောမြို့များတွင်ရှိသော အိမ်ထောင်စုတစ်ခုချင်းစီ၏ အချက်အလက်ကို ရယူသည်ဟုဆိုပါစို့။ သူမသည် အောက်ပါအချက်အလက်များ၏ ခွဲခြမ်းစိပ်ဖြာမှုကို ဖန်တီးသည်ဆိုပါစို့။
သူမသည် ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်မှုကို တွက်ချက်ပြီး ၎င်းသည် အမှန်တကယ် 0.1788 သာဖြစ်သည် – အပြုသဘောဆောင်သောဆက်စပ်ဆက်နွယ်မှုဖြစ်နေဆဲဖြစ်သော်လည်း ယခင်သုတေသီများတွေ့ရှိခဲ့သည့် ဆက်စပ်မှု ထက် ခိုင်ခံ့မှုမရှိသည်ကို တွေ့ရှိခဲ့သည်။
ဒေတာကို ပေါင်းစည်းလိုက်သောအခါ၊ တစ်ဦးချင်းအဆင့်တွင် ဖြစ်ပေါ်နေသည့် ပညာရေးနှင့် ၀င်ငွေကြား စစ်မှန်သောလမ်းကြောင်းကို ဖုံးအုပ်ထားခြင်းဖြစ်သည်။
တကယ်တော့၊ တစ်မြို့ပြီးတစ်မြို့ ကွက်ကွက်ကွင်းကွင်းကြည့်တဲ့အခါ ပညာရေးနဲ့ ၀င်ငွေကြားက ဆက်နွယ်မှုဟာ တကယ်တော့ အနုတ်လက္ခဏာပါပဲ။
စုစည်းမှု ဘက်လိုက်မှု၏ သက်ရောက်မှုများ
စုစည်းမှုအဆင့်တွင် ပေါ်လာသော လမ်းကြောင်းများသည် တစ်ဦးချင်းအဆင့်တွင်လည်း ပေါ်လာရမည်ဟု မှားယွင်းစွာ ယူဆမိသောကြောင့် သုတေသနတွင် စုစည်းဘက်လိုက်မှုမှာ မကြာခဏ ဖြစ်ပေါ်ပါသည်။ ကံမကောင်းစွာပဲ၊ ယခင်နမူနာပြထားသည့်အတိုင်း၊ ဤသည်မှာ အမြဲတမ်းမဟုတ်ပေ။
ပေါင်းစည်းမှု ဘက်လိုက်မှုသည် လေ့လာမှုတစ်ခု၏ ရလဒ်များကို မှားယွင်းသော ကောက်ချက်ဆွဲစေပြီး အထင်မှားဖြစ်စေနိုင်သည်။ ဤဘက်လိုက်မှုအမျိုးအစားသည် ကိန်းရှင်များကြား ဆက်နွယ်မှုများနှင့်ပတ်သက်ပြီး အထူးသဖြင့် အန္တရာယ်ဖြစ်စေသည်။
ကိန်းရှင်နှစ်ခု၏ ပေါင်းစပ်ဒေတာကြားဆက်စပ်မှုသည် အပြုသဘောဖြစ်နေသော်လည်း၊ တစ်ဦးချင်းကြည့်ရှုမှုအဆင့်ရှိ ကိန်းရှင်နှစ်ခုကြားတွင် နောက်ခံဆက်စပ်မှုသည် အမှန်တကယ်ဖြစ်နိုင်သည်-
- အနုတ်လက္ခဏာဆက်စပ်မှု
- ဆက်စပ်မှုမရှိပါ။
- အပြုသဘောဆောင်သောဆက်စပ်မှု
ဤဘက်လိုက်မှုအမျိုးအစားကို ရှောင်ရှားရန် နည်းလမ်းမှာ ကိန်းရှင်နှစ်ခုကြားရှိ စစ်မှန်သောဆက်နွယ်မှုကို သင်ရှာဖွေတွေ့ရှိနိုင်စေရန် စုစည်းဒေတာအချက်များထက် တစ်ဦးချင်းစီဒေတာအမှတ်များကို အသုံးပြု၍ လေ့လာမှုများပြုလုပ်ခြင်းဖြစ်သည်။