Linear discriminant analysis ကို နိဒါန်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းကိန်းရှင်များအစုတစ်ခုရှိပြီး ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်ကို အတန်းနှစ်ခုအနက်တစ်ခုအဖြစ် အမျိုးအစားခွဲခြားလိုသောအခါ၊ ကျွန်ုပ်တို့သည် ယေဘုယျအားဖြင့် ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို အသုံးပြုပါသည်။

ဥပမာအားဖြင့်၊ အောက်ပါအခြေအနေတွင် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

ပေးထားသောဖောက်သည်သည် ချေးငွေတွင် ပုံသေဖြစ်မဖြစ်ကို ခန့်မှန်းရန် ခရက်ဒစ်ရမှတ် နှင့် ဘဏ်လက်ကျန်ကို အသုံးပြုလိုပါသည်။ (တုံ့ပြန်မှု variable = “ မူလ” သို့မဟုတ် “ ပုံသေမရှိ” )

သို့သော်လည်း၊ တုံ့ပြန်မှုကိန်းရှင်တစ်ခုတွင် ဖြစ်နိုင်သည့် အတန်းအစားနှစ်ခုထက်ပိုပါက၊ ယေဘုယျအားဖြင့် LDA ဟု ခေါ်သော linear discriminant analysis ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုလိုပါသည်။

ဥပမာအားဖြင့်၊ အောက်ပါအခြေအနေတွင် ကျွန်ုပ်တို့သည် LDA ကိုသုံးနိုင်သည်။

အထက်တန်းကျောင်းသုံးဘတ်စကက်ဘောကစားသမား အား တန်းခွဲ 1၊ အပိုင်း 2 သို့မဟုတ် အပိုင်း 3 တို့တွင် ကျောင်းသုံးကျောင်းမှ လက်ခံမည်လား မခန့်မှန်းရန် ဂိမ်းတစ်ခုလျှင် အမှတ်များကို အသုံးပြုပြီး တစ်ပွဲလျှင် ပြန်တက် လိုပါသည်။

LDA နှင့် logistic regression model နှစ်မျိုးလုံးကို အမျိုးအစားခွဲ ရန်အတွက် အသုံးပြုသော်လည်း၊ LDA သည် class များစွာအတွက် ခန့်မှန်းချက်များကို ပြုလုပ်သည့်အခါတွင် LDA သည် logistic regression ထက် များစွာပိုမိုတည်ငြိမ်ပြီး ထို့ကြောင့် response variable သည် နှစ်ခုထက်ပို၍ ကြာနိုင်သောအခါတွင် အသုံးပြုရန် ဦးစားပေး algorithm ဖြစ်သည်။ အတန်းများ

နမူနာအရွယ်အစားများသည် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုနှင့် နှိုင်းယှဉ်ပါက သေးငယ်သောအခါတွင် LDA သည် အကောင်းဆုံးနမူနာများကို မစုဆောင်းနိုင်သည့်အခါ ၎င်းကို ဦးစားပေးနည်းလမ်းတစ်ခုအဖြစ် ပြုလုပ်ထားသည်။

LDA မော်ဒယ်များဖန်တီးနည်း

LDA သည် ပေးထားသော ဒေတာအတွဲတစ်ခုပေါ်တွင် အောက်ပါ ယူဆချက်ကို ပြုလုပ်သည်-

(1) ခန့်မှန်းသူ variable တစ်ခုစီ၏ တန်ဖိုးများကို ပုံမှန်အတိုင်း ဖြန့်ဝေ ပါသည်။ ဆိုလိုသည်မှာ၊ ကျွန်ုပ်တို့သည် ပေးထားသော ခန့်မှန်းသူအတွက် တန်ဖိုးများခွဲဝေမှုကို မြင်သာစေရန် histogram တစ်ခုကို ဖန်တီးပါက၊ ၎င်းတွင် အကြမ်းဖျင်းအားဖြင့် “ ခေါင်းလောင်းပုံသဏ္ဍာန်” ရှိမည်ဖြစ်သည်။

(၂) ကြိုတင်ခန့်မှန်းကိန်းရှင်တစ်ခုစီတွင် တူညီသော ကွဲလွဲမှု ရှိသည်။ လက်တွေ့ကမ္ဘာဒေတာတွင် ယင်းသည် ဘယ်တော့မှမဖြစ်သလောက်ဖြစ်ပေသည်၊ ထို့ကြောင့် ကျွန်ုပ်တို့သည် LDA မော်ဒယ်ကို အမှန်တကယ်မကိုက်ညီမီ တူညီသောအဓိပ္ပာယ်နှင့် ကွဲလွဲမှုရှိရန် ကိန်းရှင်တစ်ခုစီကို ပုံမှန်အားဖြင့် တိုင်းတာသည်။

ဤယူဆချက်များကို အတည်ပြုပြီးသည်နှင့် LDA သည် အောက်ပါတန်ဖိုးများကို ခန့်မှန်းသည်-

µ _k : ^kth အတန်း၏ လေ့ကျင့်မှုအားလုံး၏ ပျမ်းမျှ။
σ ² : k အတန်းတိုင်းအတွက် နမူနာကွဲလွဲမှုများ၏ ပျမ်းမျှအလေးချိန်။
π _k : ^kth အတန်းနှင့် သက်ဆိုင်သော လေ့ကျင့်မှု လေ့လာတွေ့ရှိချက် အချိုးအစား။

ထို့နောက် LDA သည် ဤနံပါတ်များကို အောက်ပါဖော်မြူလာတွင် ထည့်သွင်းပြီး ဖော်မြူလာမှ အကြီးဆုံးတန်ဖိုးကို ထုတ်လုပ်သည့် အတန်းသို့ လေ့လာမှုတစ်ခုစီကို X = x ကို သတ်မှတ်ပေးသည်-

d _k (x) = x * (μ _k /σ ² ) – (μ _k ² / 2σ ² ) + log(π _k )

အထက်ပါ function မှထုတ်လုပ်သောတန်ဖိုးသည် x ၏ linear function ရလဒ်မှလာသောကြောင့် LDA တွင် linear ရှိသည်ကို သတိပြုပါ။

LDA အတွက်ဒေတာပြင်ဆင်နည်း

LDA မော်ဒယ်ကို အသုံးမပြုမီ သင့်ဒေတာသည် အောက်ပါလိုအပ်ချက်များနှင့် ကိုက်ညီကြောင်း သေချာပါစေ။

1. တုံ့ပြန်မှု variable သည် categorical ဖြစ်သည် ။ LDA မော်ဒယ်များကို အမျိုးအစားခွဲခြင်းဆိုင်ရာ ပြဿနာများအတွက် အသုံးပြုရန် ဒီဇိုင်းထုတ်ထားပြီး၊ ဆိုလိုသည်မှာ တုံ့ပြန်မှုကိန်းရှင်အား အတန်းများ သို့မဟုတ် အမျိုးအစားများအဖြစ် ထားရှိနိုင်ပါသည်။

2. Predictor variable များသည် ပုံမှန်ဖြန့်ဖြူးမှုနောက်ဆက်တွဲဖြစ်သည် ။ ပထမဦးစွာ ခန့်မှန်းသူ variable တစ်ခုစီသည် ခန့်မှန်းခြေအားဖြင့် ပုံမှန်အတိုင်း ဖြန့်ဝေထားကြောင်း စစ်ဆေးပါ။ မဟုတ်ပါက၊ ဖြန့်ဝေမှုကို ပိုမိုပုံမှန်ဖြစ်စေရန် ဒေတာကို ဦးစွာအသွင်ပြောင်းရန် သင်ရွေးချယ်နိုင်သည်။

3. ခန့်မှန်းသူကိန်းရှင်တစ်ခုစီတွင် တူညီသောကွဲလွဲမှုရှိသည် ။ အစောပိုင်းတွင်ဖော်ပြခဲ့သည့်အတိုင်း၊ LDA သည် ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်တစ်ခုစီတွင် တူညီသောကွဲပြားမှုရှိသည်ဟု ယူဆသည်။ လက်တွေ့တွင် ယင်းသည် ဖြစ်ခဲသောကြောင့်၊ ၎င်းတွင် 0 နှင့် 1 ၏ စံသွေဖည်မှုရှိကြောင်း ဒေတာအတွဲရှိ ကိန်းရှင်တစ်ခုစီကို ချိန်ညှိရန် စိတ်ကူးကောင်းပါသည်။

4. လွန်ကဲလွန်ကဲသူများအတွက်အကောင့်။ LDA ကို အသုံးမပြုမီ ဒေတာအတွဲရှိ လွန်ကဲသော အစွန်းအထင်းများကို စစ်ဆေးပါ။ ပုံမှန်အားဖြင့်၊ box plots သို့မဟုတ် scatterplots များကိုအသုံးပြုရုံဖြင့် သင်အမြင်အားဖြင့် outliers ကိုစစ်ဆေးနိုင်သည်။

linear discriminant analysis ကို အသုံးပြုခြင်း ဥပမာများ

LDA မော်ဒယ်များကို လက်တွေ့ဘဝတွင် နယ်ပယ်များစွာတွင် အသုံးချသည်။ ဤသည်မှာ ဥပမာအချို့ဖြစ်သည်။

1. စျေးကွက်ရှာဖွေရေး ။ လက်လီကုမ္ပဏီများသည် စျေးဝယ်သူများကို အမျိုးအစားများစွာထဲမှ တစ်ခုအဖြစ် အမျိုးအစားခွဲရန် LDA ကို အသုံးပြုကြသည်။ ဥပမာအားဖြင့်၊ ပေးထားသောဝယ်သူသည် ၀င်ငွေ ၊ စုစုပေါင်းနှစ်စဉ်အသုံးစရိတ် နှင့် အိမ်ထောင်စုအရွယ်အစား ကဲ့သို့သော ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို အသုံးပြု၍ အနိမ့်၊ အလယ်အလတ် သို့မဟုတ် မြင့်မားသောအသုံးစရိတ်ဖြစ်မည်ကို ခန့်မှန်းရန် ၎င်းတို့သည် LDA မော်ဒယ်ကို ဖန်တီးနိုင်သည်။

၂။ဆေးဘက်ဆိုင်ရာ ။ ဆေးရုံများနှင့် ဆေးသုတေသနအဖွဲ့များသည် ပုံမှန်မဟုတ်သောဆဲလ်အုပ်စုသည် အပျော့စား၊ အလယ်အလတ် သို့မဟုတ် ပြင်းထန်သောရောဂါများဆီသို့ ဦးတည်နိုင်ခြေရှိမရှိ ခန့်မှန်းရန် LDA ကို အသုံးပြုလေ့ရှိသည်။

3. ထုတ်ကုန်ဖွံ့ဖြိုးတိုးတက်ရေး ။ ကုမ္ပဏီများ သည် ကျား ၊မ၊ နှစ်စဉ်ဝင်ငွေ နှင့် အလားတူထုတ်ကုန်များအသုံးပြုမှုအကြိမ်ရေ စသည့် အမျိုးမျိုးသော ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်များကို အခြေခံ၍ ၎င်းတို့၏ထုတ်ကုန်ကို နေ့စဉ်၊ အပတ်စဉ်၊ လစဉ် သို့မဟုတ် နှစ်စဉ် အသုံးပြုမည်ဆိုသည်ကို ခန့်မှန်းရန် LDA မော်ဒယ်များကို ဖန်တီးနိုင်သည်။

4. ဂေဟဗေဒ။ သုတေသီများသည် အရွယ်အစား ၊ နှစ်စဉ် ညစ်ညမ်းမှု နှင့် ဆုံးရှုံးမှု ကဲ့သို့သော ကြိုတင်ခန့်မှန်းကိန်းရှင် အမျိုးမျိုးအပေါ် အခြေခံ၍ ပေးထားသော သန္တာကျောက်တန်းတွင် ကောင်းမွန်သော၊ အလယ်အလတ်၊ ညံ့ဖျင်းခြင်း သို့မဟုတ် ပျောက်ကွယ်လုနီးပါးဖြစ်နိုင်ခြေရှိမရှိ ခန့်မှန်းရန် LDA မော်ဒယ်များကို ဖန်တီးနိုင်သည်။ အသက် .

R နှင့် Python တွင် LDA

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R နှင့် Python တွင် linear discriminant analysis လုပ်နည်းကို အဆင့်ဆင့် ဥပမာပေးပါသည်။

R တွင် တစ်ပြေးညီ ခွဲခြားမှု ခွဲခြမ်းစိတ်ဖြာခြင်း (တစ်ဆင့်ပြီးတစ်ဆင့်)
Python တွင် Linear Discriminant Analysis (အဆင့်ဆင့်)

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။