Linear discriminant analysis ကို နိဒါန်း
ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းကိန်းရှင်များအစုတစ်ခုရှိပြီး ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်ကို အတန်းနှစ်ခုအနက်တစ်ခုအဖြစ် အမျိုးအစားခွဲခြားလိုသောအခါ၊ ကျွန်ုပ်တို့သည် ယေဘုယျအားဖြင့် ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို အသုံးပြုပါသည်။
ဥပမာအားဖြင့်၊ အောက်ပါအခြေအနေတွင် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
- ပေးထားသောဖောက်သည်သည် ချေးငွေတွင် ပုံသေဖြစ်မဖြစ်ကို ခန့်မှန်းရန် ခရက်ဒစ်ရမှတ် နှင့် ဘဏ်လက်ကျန်ကို အသုံးပြုလိုပါသည်။ (တုံ့ပြန်မှု variable = “ မူလ” သို့မဟုတ် “ ပုံသေမရှိ” )
သို့သော်လည်း၊ တုံ့ပြန်မှုကိန်းရှင်တစ်ခုတွင် ဖြစ်နိုင်သည့် အတန်းအစားနှစ်ခုထက်ပိုပါက၊ ယေဘုယျအားဖြင့် LDA ဟု ခေါ်သော linear discriminant analysis ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုလိုပါသည်။
ဥပမာအားဖြင့်၊ အောက်ပါအခြေအနေတွင် ကျွန်ုပ်တို့သည် LDA ကိုသုံးနိုင်သည်။
- အထက်တန်းကျောင်းသုံးဘတ်စကက်ဘောကစားသမား အား တန်းခွဲ 1၊ အပိုင်း 2 သို့မဟုတ် အပိုင်း 3 တို့တွင် ကျောင်းသုံးကျောင်းမှ လက်ခံမည်လား မခန့်မှန်းရန် ဂိမ်းတစ်ခုလျှင် အမှတ်များကို အသုံးပြုပြီး တစ်ပွဲလျှင် ပြန်တက် လိုပါသည်။
LDA နှင့် logistic regression model နှစ်မျိုးလုံးကို အမျိုးအစားခွဲ ရန်အတွက် အသုံးပြုသော်လည်း၊ LDA သည် class များစွာအတွက် ခန့်မှန်းချက်များကို ပြုလုပ်သည့်အခါတွင် LDA သည် logistic regression ထက် များစွာပိုမိုတည်ငြိမ်ပြီး ထို့ကြောင့် response variable သည် နှစ်ခုထက်ပို၍ ကြာနိုင်သောအခါတွင် အသုံးပြုရန် ဦးစားပေး algorithm ဖြစ်သည်။ အတန်းများ
နမူနာအရွယ်အစားများသည် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုနှင့် နှိုင်းယှဉ်ပါက သေးငယ်သောအခါတွင် LDA သည် အကောင်းဆုံးနမူနာများကို မစုဆောင်းနိုင်သည့်အခါ ၎င်းကို ဦးစားပေးနည်းလမ်းတစ်ခုအဖြစ် ပြုလုပ်ထားသည်။
LDA မော်ဒယ်များဖန်တီးနည်း
LDA သည် ပေးထားသော ဒေတာအတွဲတစ်ခုပေါ်တွင် အောက်ပါ ယူဆချက်ကို ပြုလုပ်သည်-
(1) ခန့်မှန်းသူ variable တစ်ခုစီ၏ တန်ဖိုးများကို ပုံမှန်အတိုင်း ဖြန့်ဝေ ပါသည်။ ဆိုလိုသည်မှာ၊ ကျွန်ုပ်တို့သည် ပေးထားသော ခန့်မှန်းသူအတွက် တန်ဖိုးများခွဲဝေမှုကို မြင်သာစေရန် histogram တစ်ခုကို ဖန်တီးပါက၊ ၎င်းတွင် အကြမ်းဖျင်းအားဖြင့် “ ခေါင်းလောင်းပုံသဏ္ဍာန်” ရှိမည်ဖြစ်သည်။
(၂) ကြိုတင်ခန့်မှန်းကိန်းရှင်တစ်ခုစီတွင် တူညီသော ကွဲလွဲမှု ရှိသည်။ လက်တွေ့ကမ္ဘာဒေတာတွင် ယင်းသည် ဘယ်တော့မှမဖြစ်သလောက်ဖြစ်ပေသည်၊ ထို့ကြောင့် ကျွန်ုပ်တို့သည် LDA မော်ဒယ်ကို အမှန်တကယ်မကိုက်ညီမီ တူညီသောအဓိပ္ပာယ်နှင့် ကွဲလွဲမှုရှိရန် ကိန်းရှင်တစ်ခုစီကို ပုံမှန်အားဖြင့် တိုင်းတာသည်။
ဤယူဆချက်များကို အတည်ပြုပြီးသည်နှင့် LDA သည် အောက်ပါတန်ဖိုးများကို ခန့်မှန်းသည်-
- µ k : kth အတန်း၏ လေ့ကျင့်မှုအားလုံး၏ ပျမ်းမျှ။
- σ 2 : k အတန်းတိုင်းအတွက် နမူနာကွဲလွဲမှုများ၏ ပျမ်းမျှအလေးချိန်။
- π k : kth အတန်းနှင့် သက်ဆိုင်သော လေ့ကျင့်မှု လေ့လာတွေ့ရှိချက် အချိုးအစား။
ထို့နောက် LDA သည် ဤနံပါတ်များကို အောက်ပါဖော်မြူလာတွင် ထည့်သွင်းပြီး ဖော်မြူလာမှ အကြီးဆုံးတန်ဖိုးကို ထုတ်လုပ်သည့် အတန်းသို့ လေ့လာမှုတစ်ခုစီကို X = x ကို သတ်မှတ်ပေးသည်-
d k (x) = x * (μ k /σ 2 ) – (μ k 2 / 2σ 2 ) + log(π k )
အထက်ပါ function မှထုတ်လုပ်သောတန်ဖိုးသည် x ၏ linear function ရလဒ်မှလာသောကြောင့် LDA တွင် linear ရှိသည်ကို သတိပြုပါ။
LDA အတွက်ဒေတာပြင်ဆင်နည်း
LDA မော်ဒယ်ကို အသုံးမပြုမီ သင့်ဒေတာသည် အောက်ပါလိုအပ်ချက်များနှင့် ကိုက်ညီကြောင်း သေချာပါစေ။
1. တုံ့ပြန်မှု variable သည် categorical ဖြစ်သည် ။ LDA မော်ဒယ်များကို အမျိုးအစားခွဲခြင်းဆိုင်ရာ ပြဿနာများအတွက် အသုံးပြုရန် ဒီဇိုင်းထုတ်ထားပြီး၊ ဆိုလိုသည်မှာ တုံ့ပြန်မှုကိန်းရှင်အား အတန်းများ သို့မဟုတ် အမျိုးအစားများအဖြစ် ထားရှိနိုင်ပါသည်။
2. Predictor variable များသည် ပုံမှန်ဖြန့်ဖြူးမှုနောက်ဆက်တွဲဖြစ်သည် ။ ပထမဦးစွာ ခန့်မှန်းသူ variable တစ်ခုစီသည် ခန့်မှန်းခြေအားဖြင့် ပုံမှန်အတိုင်း ဖြန့်ဝေထားကြောင်း စစ်ဆေးပါ။ မဟုတ်ပါက၊ ဖြန့်ဝေမှုကို ပိုမိုပုံမှန်ဖြစ်စေရန် ဒေတာကို ဦးစွာအသွင်ပြောင်းရန် သင်ရွေးချယ်နိုင်သည်။
3. ခန့်မှန်းသူကိန်းရှင်တစ်ခုစီတွင် တူညီသောကွဲလွဲမှုရှိသည် ။ အစောပိုင်းတွင်ဖော်ပြခဲ့သည့်အတိုင်း၊ LDA သည် ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်တစ်ခုစီတွင် တူညီသောကွဲပြားမှုရှိသည်ဟု ယူဆသည်။ လက်တွေ့တွင် ယင်းသည် ဖြစ်ခဲသောကြောင့်၊ ၎င်းတွင် 0 နှင့် 1 ၏ စံသွေဖည်မှုရှိကြောင်း ဒေတာအတွဲရှိ ကိန်းရှင်တစ်ခုစီကို ချိန်ညှိရန် စိတ်ကူးကောင်းပါသည်။
4. လွန်ကဲလွန်ကဲသူများအတွက်အကောင့်။ LDA ကို အသုံးမပြုမီ ဒေတာအတွဲရှိ လွန်ကဲသော အစွန်းအထင်းများကို စစ်ဆေးပါ။ ပုံမှန်အားဖြင့်၊ box plots သို့မဟုတ် scatterplots များကိုအသုံးပြုရုံဖြင့် သင်အမြင်အားဖြင့် outliers ကိုစစ်ဆေးနိုင်သည်။
linear discriminant analysis ကို အသုံးပြုခြင်း ဥပမာများ
LDA မော်ဒယ်များကို လက်တွေ့ဘဝတွင် နယ်ပယ်များစွာတွင် အသုံးချသည်။ ဤသည်မှာ ဥပမာအချို့ဖြစ်သည်။
1. စျေးကွက်ရှာဖွေရေး ။ လက်လီကုမ္ပဏီများသည် စျေးဝယ်သူများကို အမျိုးအစားများစွာထဲမှ တစ်ခုအဖြစ် အမျိုးအစားခွဲရန် LDA ကို အသုံးပြုကြသည်။ ဥပမာအားဖြင့်၊ ပေးထားသောဝယ်သူသည် ၀င်ငွေ ၊ စုစုပေါင်းနှစ်စဉ်အသုံးစရိတ် နှင့် အိမ်ထောင်စုအရွယ်အစား ကဲ့သို့သော ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို အသုံးပြု၍ အနိမ့်၊ အလယ်အလတ် သို့မဟုတ် မြင့်မားသောအသုံးစရိတ်ဖြစ်မည်ကို ခန့်မှန်းရန် ၎င်းတို့သည် LDA မော်ဒယ်ကို ဖန်တီးနိုင်သည်။
၂။ဆေးဘက်ဆိုင်ရာ ။ ဆေးရုံများနှင့် ဆေးသုတေသနအဖွဲ့များသည် ပုံမှန်မဟုတ်သောဆဲလ်အုပ်စုသည် အပျော့စား၊ အလယ်အလတ် သို့မဟုတ် ပြင်းထန်သောရောဂါများဆီသို့ ဦးတည်နိုင်ခြေရှိမရှိ ခန့်မှန်းရန် LDA ကို အသုံးပြုလေ့ရှိသည်။
3. ထုတ်ကုန်ဖွံ့ဖြိုးတိုးတက်ရေး ။ ကုမ္ပဏီများ သည် ကျား ၊မ၊ နှစ်စဉ်ဝင်ငွေ နှင့် အလားတူထုတ်ကုန်များအသုံးပြုမှုအကြိမ်ရေ စသည့် အမျိုးမျိုးသော ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်များကို အခြေခံ၍ ၎င်းတို့၏ထုတ်ကုန်ကို နေ့စဉ်၊ အပတ်စဉ်၊ လစဉ် သို့မဟုတ် နှစ်စဉ် အသုံးပြုမည်ဆိုသည်ကို ခန့်မှန်းရန် LDA မော်ဒယ်များကို ဖန်တီးနိုင်သည်။
4. ဂေဟဗေဒ။ သုတေသီများသည် အရွယ်အစား ၊ နှစ်စဉ် ညစ်ညမ်းမှု နှင့် ဆုံးရှုံးမှု ကဲ့သို့သော ကြိုတင်ခန့်မှန်းကိန်းရှင် အမျိုးမျိုးအပေါ် အခြေခံ၍ ပေးထားသော သန္တာကျောက်တန်းတွင် ကောင်းမွန်သော၊ အလယ်အလတ်၊ ညံ့ဖျင်းခြင်း သို့မဟုတ် ပျောက်ကွယ်လုနီးပါးဖြစ်နိုင်ခြေရှိမရှိ ခန့်မှန်းရန် LDA မော်ဒယ်များကို ဖန်တီးနိုင်သည်။ အသက် .
R နှင့် Python တွင် LDA
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R နှင့် Python တွင် linear discriminant analysis လုပ်နည်းကို အဆင့်ဆင့် ဥပမာပေးပါသည်။
R တွင် တစ်ပြေးညီ ခွဲခြားမှု ခွဲခြမ်းစိတ်ဖြာခြင်း (တစ်ဆင့်ပြီးတစ်ဆင့်)
Python တွင် Linear Discriminant Analysis (အဆင့်ဆင့်)