Univariate သို့မဟုတ် multivariate ခွဲခြမ်းစိတ်ဖြာမှု- ကွာခြားချက်ကား အဘယ်နည်း။


univariate analysis ဟူသော ဝေါဟာရသည် ကိန်းရှင်တစ်ခု၏ ခွဲခြမ်းစိတ်ဖြာမှုကို ရည်ညွှန်းသည်။ ရှေ့ဆက် “ uni” သည် “ one” ဖြစ်သောကြောင့်၎င်းကိုသင်မှတ်မိနိုင်သည်။

Multivariate analysis ဟူသော ဝေါဟာရသည် ကိန်းရှင်တစ်ခုထက်ပိုသော ခွဲခြမ်းစိတ်ဖြာခြင်းကို ရည်ညွှန်းသည်။ ရှေ့ဆက် “multi” ဆိုသည်မှာ “တစ်ခုထက်ပိုသည်” ဖြစ်သောကြောင့် ၎င်းကို သင်မှတ်မိနိုင်သည်။

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် ဘုံနည်းလမ်းသုံးမျိုးရှိပါသည်။

1. စာရင်းဇယားအကျဉ်းချုပ်

  • ကိန်းရှင်တစ်ခုအတွက် ပျမ်းမျှ သို့မဟုတ် အလယ်အလတ်ကဲ့သို့ ဗဟိုသဘောထားကို တိုင်းတာ တွက်ချက်နိုင်သည်။
  • ကိန်းရှင်တစ်ခုအတွက် စံသွေဖည်မှုကဲ့သို့သော ကွဲလွဲမှုအတိုင်းအတာများကို တွက်ချက်နိုင်သည်။

2. အကြိမ်ရေ ဖြန့်ဝေမှုများ

  • ကိန်းရှင်တစ်ခုအတွက် တန်ဖိုးတစ်ခုစီတွင် မည်မျှမကြာခဏပေါ်လာသည်ကို ဖော်ပြသည့် ကြိမ်နှုန်းဖြန့်ဝေမှု တစ်ခုကို ကျွန်ုပ်တို့ဖန်တီးနိုင်သည်။

3. ဂရပ်ဖစ်

  • ကျွန်ုပ်တို့သည် boxplots၊ histograms၊ density plot စသည်တို့ကဲ့သို့သော ဂရပ်များကို ဖန်တီးနိုင်သည်။ variable တစ်ခု၏ တန်ဖိုးများကို ဖြန့်ကျက်မြင်ယောင်ရန်။

Multivariate ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် ဘုံနည်းလမ်းနှစ်ခုရှိသည်။

1. ကွက်ကွက်မက်ထရစ်ကို ဖြန့်ကြဲပါ။

  • ကျွန်ုပ်တို့သည် data set တစ်ခုရှိ variable များ၏ pairwise ပေါင်းစပ်မှုတစ်ခုစီကြားရှိ ဆက်စပ်မှုကို မြင်ယောင်နိုင်စေသည့် scatterplot matrix တစ်ခုကို ဖန်တီးနိုင်သည်။

2. Machine learning algorithms

  • ကြိုတင်ခန့်မှန်းကိန်းရှင် ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်များစွာကြားရှိ ဆက်နွယ်မှုကို တိုင်းတာပေးသည့် Multiple linear regression ကဲ့သို့သော မော်ဒယ်တစ်ခုကို အံဝင်ခွင်ကျဖြစ်အောင် ကြီးကြပ်သင်ကြားမှု အယ်လဂိုရီသမ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။
  • ဒေတာအတွဲတစ်ခုရှိ ကိန်းရှင်များစွာကြားရှိ တည်ဆောက်ပုံနှင့် ဆက်စပ်မှုများကို တစ်ပြိုင်နက်ရှာဖွေရန် အဓိကအစိတ်အပိုင်းခွဲခြမ်းစိတ်ဖြာမှု ကဲ့သို့ ကြီးကြပ်မထားသော သင်ယူမှု အယ်လဂိုရီသမ်ကို ကျွန်ုပ်တို့လည်း အသုံးပြုနိုင်ပါသည်။

အောက်ဖော်ပြပါ ဥပမာများသည် အောက်ဖော်ပြပါ ဒေတာအစုံဖြင့် တစ်ပုံစံတည်းနှင့် အမျိုးမျိုးကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-

မှတ်ချက် – ကိန်းရှင်နှစ်ခုကို အတိအကျခွဲခြမ်းစိတ်ဖြာသောအခါ၊ ၎င်းကို bivariate analysis ဟုခေါ်သည်။

ဥပမာ- မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု ပြုလုပ်နည်း

ဒေတာအတွဲရှိ တစ်ဦးချင်း ကိန်းရှင်များထဲမှ ကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုတစ်ခုကို လုပ်ဆောင်ရန် ကျွန်ုပ်တို့ ရွေးချယ်နိုင်ပါသည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် ပြောင်းလဲနိုင်သော အိမ်ထောင်စု အရွယ်အစား အပေါ် ကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် ရွေးချယ်နိုင်သည်-

မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု ဥပမာ

အိမ်ထောင်စုအရွယ်အစား၏ ဗဟိုသဘောထားကို အောက်ပါအတိုင်းအတာများကို တွက်ချက်နိုင်သည်-

  • ပျမ်းမျှ (ပျမ်းမျှတန်ဖိုး) : 3.8
  • ပျမ်းမျှ (ပျမ်းမျှတန်ဖိုး) 4

ဤတန်ဖိုးများသည် ကျွန်ုပ်တို့အား “ဗဟို” တန်ဖိုးသည် မည်သည့်နေရာတွင် ရှိနေသည်ကို အကြံဥာဏ်ပေးသည်။

အောက်ဖော်ပြပါ ပျံ့နှံ့မှုအတိုင်းအတာကိုလည်း တွက်ချက်နိုင်သည်-

  • အပိုင်းအခြား (အမြင့်ဆုံးနှင့် အနည်းဆုံး ကွာခြားချက်): 6
  • Interquartile စကေး (တန်ဖိုးများ၏ အလယ် 50% ၏ ဖြန့်ဖြူးမှု)- 2.5
  • စံသွေဖည်မှု (ပျံ့နှံ့မှုပျမ်းမျှအတိုင်းအတာ) 1.87

ဤတန်ဖိုးများသည် ကျွန်ုပ်တို့အား ဤကိန်းရှင်၏ တန်ဖိုးများ ဖြန့်ဖြူးခြင်း၏ အကြံဥာဏ်ကို ပေးသည်။

မတူညီသောတန်ဖိုးများ မည်မျှဖြစ်ပွားလေ့ရှိသည်ကို အကျဉ်းချုပ်ဖော်ပြရန် အောက်ဖော်ပြပါ ကြိမ်နှုန်းဖြန့်ဖြူးမှုဇယားကိုလည်း ဖန်တီးနိုင်သည်-

အိမ်ထောင်စု အရွယ်အစားအလိုက် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် boxplot တစ်ခုကိုလည်း ဖန်တီးနိုင်သည်-

တနည်းအားဖြင့် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို မြင်သာစေရန် histogram တစ်ခုကို ဖန်တီးနိုင်သည်-

ဤတိုင်းတာမှုများကို တွက်ချက်ပြီး ဤဂရပ်များကို ဖန်တီးခြင်းဖြင့်၊ Household Size variable အတွက် တန်ဖိုးများကို မည်ကဲ့သို့ ဖြန့်ဝေသည်ကို ကျွန်ုပ်တို့ ပိုမိုကောင်းမွန်စွာ နားလည်နိုင်ပါသည်။

ဥပမာ- Multivariate Analysis လုပ်နည်း

ကျွန်ုပ်တို့တွင် တူညီသော ဒေတာအစုံရှိကြောင်း ထပ်မံယူဆကြပါစို့။

ဤဒေတာအတွဲတွင် ကျွန်ုပ်တို့လုပ်ဆောင်နိုင်သည့် အမျိုးမျိုးကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု၏ ရိုးရှင်းသောပုံစံမှာ ဒေတာအတွဲရှိ ကိန်းဂဏာန်းကိန်းရှင်များ၏ အတွဲလိုက်တစ်ခုစီအတွက် ခွဲခြမ်းစိတ်ဖြာမှုကို ပြသသည့် ဖြန့် ကြက်မှုမက် ထရစ်ကို ဖန်တီးရန်ဖြစ်သည်။

အိမ်ထောင်စု အရွယ်အစား၊ နှစ်စဉ်ဝင်ငွေနှင့် အိမ်မွေးတိရစ္ဆာန် အရေအတွက်တို့ကြား ဆက်စပ်မှုကို တစ်ပြိုင်နက် မြင်ယောင်နိုင်ရန် ဤ matrix အမျိုးအစားကို ဖန်တီးနိုင်သည်။

အရင်းအမြစ် – R တွင် scatterplot matrix ဖန်တီးနည်းကို ကြည့်ရှုရန် ဤသင်ခန်းစာကို ကြည့်ပါ။

ဤဒေတာအတွဲတွင် အမျိုးမျိုးကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် အခြားနည်းလမ်းမှာ မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံ အများအပြားနှင့် ကိုက်ညီရန်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ နှစ်စဉ်ဝင်ငွေကို ခန့်မှန်းရန် အိမ်မွေးတိရစ္ဆာန်အရွယ်အစားနှင့် အိမ်မွေးတိရစ္ဆာန်အရေအတွက်ကို အသုံးပြုသည့် ဆုတ်ယုတ်မှုပုံစံကို ဖန်တီးနိုင်သည်။

အရင်းအမြစ် – R တွင် မျဉ်းကြောင်းပြန်ဆုတ်ခြင်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ကြည့်ရှုရန် ဤသင်ခန်းစာကို ကြည့်ပါ။

ဤဒေတာအတွဲအပေါ် အမျိုးမျိုးကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန် အခြားနည်းလမ်းမှာ ဒေတာအတွဲတွင် နောက်ခံဖွဲ့စည်းပုံကို ရှာဖွေနိုင်စေသည့် အဓိကအစိတ်အပိုင်းခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ရန်ဖြစ်သည်။

အရင်းအမြစ် – R တွင် အဓိကအစိတ်အပိုင်းခွဲခြမ်းစိတ်ဖြာနည်းကို ကြည့်ရှုရန် ဤသင်ခန်းစာကို ကြည့်ပါ။

နိဂုံး

ဤဆောင်းပါး၏ အကျဉ်းချုပ်မှာ ဤအရာဖြစ်သည် ။

  • Univariate analysis သည် variable တစ်ခု၏ခွဲခြမ်းစိတ်ဖြာမှုဖြစ်သည်။
  • Multivariate analysis သည် variable တစ်ခုထက်ပိုသော ခွဲခြမ်းစိတ်ဖြာမှုဖြစ်သည်။
  • သင်၏အဆုံးပန်းတိုင်အပေါ် မူတည်၍ ခွဲခြမ်းစိတ်ဖြာမှုအမျိုးအစားတစ်ခုစီကို လုပ်ဆောင်ရန် မတူညီသောနည်းလမ်းများရှိသည်။
  • လက်တွေ့ကမ္ဘာတွင်၊ ကျွန်ုပ်တို့သည် ဒေတာအစုတစ်ခုတည်းတွင် ခွဲခြမ်းစိတ်ဖြာမှု နှစ်မျိုးလုံးကို လုပ်ဆောင်လေ့ရှိသည်။
  • မတူကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှု သည် ကျွန်ုပ်တို့အား ကိန်းရှင်တစ်ခုအတွက် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို နားလည်နိုင်စေပြီး အမျိုးမျိုးကွဲပြားသော ခွဲခြမ်းစိတ်ဖြာမှုမှ ကျွန်ုပ်တို့အား များစွာသော ကိန်းရှင်များကြား ဆက်နွယ်မှုကို နားလည်နိုင်စေပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်