Univariate analysis ဆိုတာ ဘာလဲ ။ (အဓိပ္ပါယ် & #038; ဥပမာ)


univariate analysis ဟူသော ဝေါဟာရသည် ကိန်းရှင်တစ်ခု၏ ခွဲခြမ်းစိတ်ဖြာမှုကို ရည်ညွှန်းသည်။ ရှေ့ဆက် “ uni” သည် “ one” ဖြစ်သောကြောင့်၎င်းကိုသင်မှတ်မိနိုင်သည်။

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု၏ ပန်းတိုင်မှာ ကိန်းရှင်တစ်ခုတည်းအတွက် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို နားလည်ရန်ဖြစ်သည်။ ဤအမျိုးအစားခွဲခြမ်းစိတ်ဖြာချက်ကို အောက်ပါတို့နှင့် နှိုင်းယှဉ်နိုင်သည်။

  • Bivariate ခွဲခြမ်းစိတ်ဖြာမှု ကိန်းရှင်နှစ်ခု၏ခွဲခြမ်းစိတ်ဖြာမှု။
  • Multivariate ခွဲခြမ်းစိတ်ဖြာခြင်း- နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ကိန်းရှင်များကို ခွဲခြမ်းစိတ်ဖြာခြင်း။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။

၎င်း၏တန်ဖိုးများ ခွဲဝေမှုကို ပိုမိုကောင်းမွန်စွာ နားလည်ရန် ဒေတာအတွဲရှိ တစ်ဦးချင်း ကိန်းရှင်များထဲမှ တစ်ခုကို တစ်ပုံစံတည်း ခွဲခြမ်းစိတ်ဖြာမှု ပြုလုပ်ရန် ကျွန်ုပ်တို့ ရွေးချယ်နိုင်ပါသည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် ပြောင်းလဲနိုင်သော အိမ်ထောင်စု အရွယ်အစား အပေါ် ကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် ရွေးချယ်နိုင်သည်-

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု ဥပမာ

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် ဘုံနည်းလမ်းသုံးမျိုးရှိသည်။

1. စာရင်းဇယားအကျဉ်းချုပ်

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် အသုံးအများဆုံးနည်းလမ်းမှာ အနှစ်ချုပ်စာရင်းဇယားကို အသုံးပြု၍ ကိန်းရှင်တစ်ခုကို ဖော်ပြခြင်းဖြစ်သည်။

အနှစ်ချုပ်စာရင်းဇယား၏ ယေဘူယျ အမျိုးအစား နှစ်မျိုးရှိသည်။

  • ဗဟိုသဘောထားကို အတိုင်းအတာများ : ဤကိန်းဂဏာန်းများသည် ဒေတာအစုတစ်ခု၏ ဗဟိုတည်နေရာကို ဖော်ပြသည်။ ဥပမာများတွင် mean နှင့် median ပါဝင်သည်။
  • Dispersion Measures : ဤကိန်းဂဏာန်းများသည် ဒေတာအစုံရှိ တန်ဖိုးများ ဖြန့်ဖြူးမှုကို ဖော်ပြသည်။ ဥပမာများတွင် ကြားကာလinterquartile အကွာအဝေးစံသွေဖည်မှု နှင့် ကွဲလွဲမှုတို့ ပါဝင်သည်။

2. အကြိမ်ရေ ဖြန့်ဝေမှုများ

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် အခြားနည်းလမ်းမှာ ဒေတာအတွဲတစ်ခုတွင် မတူညီသည့်တန်ဖိုးများ မည်မျှမကြာခဏ ပေါ်ထွက်သည်ကို ဖော်ပြသည့် ကြိမ်နှုန်းဖြန့်ဖြူးမှု တစ်ခု ဖန်တီးရန်ဖြစ်သည်။

3. ဂရပ်ဖစ်

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် အခြားနည်းလမ်းမှာ အချို့သော ကိန်းရှင်တစ်ခုအတွက် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် ဂရပ်များကို ဖန်တီးရန်ဖြစ်သည်။

ယေဘူယျ ဥပမာများ ပါဝင်သည်။

  • ကွက်ကွက်များ
  • ဟစ်စတိုဂရမ်များ
  • သိပ်သည်းဆ မျဉ်းကွေးများ
  • Camemberts

အောက်ဖော်ပြပါနမူနာများသည် ကျွန်ုပ်တို့၏ယခင်ဖော်ပြထားသောဒေတာအတွဲမှ အိမ်သူအိမ်သားအရွယ်အစား ပြောင်းလဲမှုကိုအသုံးပြု၍တစ်မူထူးခြားသောခွဲခြမ်းစိတ်ဖြာမှုအမျိုးအစားတစ်ခုစီကိုမည်သို့လုပ်ဆောင်ရမည်ကိုပြသသည်-

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု ဥပမာ

စာရင်းဇယားအကျဉ်းချုပ်

အိမ်ထောင်စုအရွယ်အစား၏ ဗဟိုသဘောထားကို အောက်ပါအတိုင်းအတာများကို တွက်ချက်နိုင်သည်-

  • ပျမ်းမျှ (ပျမ်းမျှတန်ဖိုး) : 3.8
  • ပျမ်းမျှ (ပျမ်းမျှတန်ဖိုး) 4

ဤတန်ဖိုးများသည် ကျွန်ုပ်တို့အား “ဗဟို” တန်ဖိုးသည် မည်သည့်နေရာတွင် ရှိနေသည်ကို အကြံဥာဏ်ပေးသည်။

အောက်ဖော်ပြပါ ပျံ့နှံ့မှုအတိုင်းအတာကိုလည်း တွက်ချက်နိုင်သည်-

  • အပိုင်းအခြား (အမြင့်ဆုံးနှင့် အနည်းဆုံး ကွာခြားချက်): 6
  • Interquartile စကေး (တန်ဖိုးများ၏ အလယ် 50% ၏ ဖြန့်ဖြူးမှု)- 2.5
  • စံသွေဖည်မှု (ပျံ့နှံ့မှုပျမ်းမျှအတိုင်းအတာ) 1.87

ဤတန်ဖိုးများသည် ကျွန်ုပ်တို့အား ဤကိန်းရှင်၏ တန်ဖိုးများ ဖြန့်ဖြူးခြင်း၏ အကြံဥာဏ်ကို ပေးသည်။

အကြိမ်ရေ ဖြန့်ဖြူးခြင်း။

မတူညီသောတန်ဖိုးများ မည်မျှဖြစ်ပွားလေ့ရှိသည်ကို အကျဉ်းချုပ်ဖော်ပြရန် အောက်ဖော်ပြပါ ကြိမ်နှုန်းဖြန့်ဖြူးမှုဇယားကိုလည်း ဖန်တီးနိုင်သည်-

ဤအရာက ကျွန်ုပ်တို့အား အတွေ့ရအများဆုံး အိမ်ထောင်စုအရွယ်အစားမှာ 4 ယောက် ဖြစ်ကြောင်း လျင်မြန်စွာ သိမြင်နိုင်စေပါသည်။

အရင်းအမြစ်- မည်သည့်ကိန်းရှင်အတွက်မဆို ကြိမ်နှုန်းခွဲဝေမှုကို အလိုအလျောက်ထုတ်လုပ်ရန် ဤ အကြိမ်ရေဂဏန်းတွက်စက်ကို သင်အသုံးပြုနိုင်ပါသည်။

ဂရပ်ဖစ်

အိမ်ထောင်စု အရွယ်အစားအတွက် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာအောင် ကူညီပေးနိုင်ရန် အောက်ပါဂရပ်များကို ကျွန်ုပ်တို့ ဖန်တီးနိုင်သည်-

1. ကွက်လပ်

boxplot သည် ဒေတာအတွဲတစ်ခု၏ ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို ပြသသည့် ဂရပ်တစ်ခုဖြစ်သည်။

နံပါတ်ငါးအနှစ်ချုပ်တွင်-

  • အနိမ့်ဆုံးတန်ဖိုး
  • ပထမလေးပုံတစ်ပုံ
  • ပျမ်းမျှတန်ဖိုး
  • တတိယလေးပုံတစ်ပုံ
  • အများဆုံးတန်ဖိုး

ဤသည်မှာ အိမ်သူအိမ်သားအရွယ်အစား variable အတွက် boxplot သည် မည်သို့သောပုံသဏ္ဌာန်ရှိမည်နည်း။

အရင်းအမြစ်- သင်သည် မည်သည့်ကိန်းရှင်အတွက်မဆို boxplot တစ်ခုကို အလိုအလျောက်ထုတ်လုပ်ရန် ဤ boxplot generator ကို အသုံးပြုနိုင်သည်။

2. Histogram

ဟီစတိုဂရမ်သည် ကြိမ်နှုန်းများကိုပြသရန် ဒေါင်လိုက်ဘားများကို အသုံးပြုသည့် ဇယားအမျိုးအစားတစ်ခုဖြစ်သည်။ ဤဇယားအမျိုးအစားသည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဝေမှုကို မြင်သာစေရန် အသုံးဝင်သောနည်းလမ်းတစ်ခုဖြစ်သည်။

ဤသည်မှာ အိမ်သူအိမ်သား အရွယ်အစား ပြောင်းလဲနိုင်သော အတွက် ဟီစတိုဂရမ်ပုံသဏ္ဌာန် ဖြစ်သည်-

3. သိပ်သည်းဆမျဉ်းကွေး

သိပ်သည်းဆမျဉ်းကွေး ဆိုသည်မှာ ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများ ဖြန့်ဖြူးခြင်းကို ကိုယ်စားပြုသော ဂရပ်တစ်ခုပေါ်ရှိ မျဉ်းကွေးတစ်ခုဖြစ်သည်။

ဖြန့်ဖြူးမှုတစ်ခုတွင် မကြာခဏတန်ဖိုးများ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော “ အထွတ်အထိပ်များ” ရှိ၊ မရှိနှင့် ဖြန့်ဖြူးမှုအား ဘယ် သို့မဟုတ် ညာဘက်သို့ စောင်းသွားခြင်းရှိ

ဤသည်မှာ Household Size variable အတွက် density curve သည် မည်သို့သော ပုံသဏ္ဌာန်ရှိမည်နည်း။

4. စက်ဝိုင်းပုံ ဇယား

အဝိုင်းပုံဇယားသည် စက်ဝိုင်းပုံသဏ္ဍာန်ပုံစံဇယား အမျိုးအစားဖြစ်ပြီး တစ်ခုလုံး၏အချိုးအစားများကိုကိုယ်စားပြုရန် အချပ်များကို အသုံးပြုသည်။

ဤသည်မှာ အိမ်သူအိမ်သား အရွယ်အစား ကိန်းရှင်အတွက် အဝိုင်းပုံဇယားပုံသဏ္ဌာန် ဖြစ်သည်-

ဒေတာအမျိုးအစားပေါ်မူတည်၍ ဤဇယားများထဲမှတစ်ခုသည် တန်ဖိုးများခွဲဝေမှုကို မြင်သာစေရန်အတွက် အခြားပုံစံများထက် ပို၍အသုံးဝင်ပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်