Excel တွင် dummy variable များဖန်တီးနည်း (အဆင့်ဆင့်)


dummy variable သည် regression ခွဲခြမ်းစိတ်ဖြာမှုတွင် ကျွန်ုပ်တို့ဖန်တီးထားသော variable အမျိုးအစားတစ်ခုဖြစ်ပြီး တန်ဖိုးနှစ်ခုမှ တစ်ခုဖြစ်သော သုည သို့မဟုတ် တစ်ခုအား ကိန်းဂဏာန်းကိန်းရှင်အဖြစ် categorical variable အဖြစ် ကိုယ်စားပြုနိုင်စေရန်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိပြီး ဝင်ငွေကို ခန့်မှန်းရန် အသက်အရွယ် နှင့် အိမ်ထောင်ရေးအဆင့်အတန်းကို အသုံးပြုလိုသည်ဆိုပါစို့။

ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ အိမ်ထောင်ရေးအခြေအနေအား ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်အဖြစ် အသုံးပြုရန်၊ ၎င်းကို အတုမဲ့ကိန်းရှင်အဖြစ် ပြောင်းလဲရန် လိုအပ်သည်။

၎င်းသည် လောလောဆယ်တွင် မတူညီသောတန်ဖိုး (“ လူပျို” ၊ “ အိမ်ထောင်သည်” သို့မဟုတ် “ ကွာရှင်းသည်” ) တွင် မတူညီသောတန်ဖိုးသုံးခုကိုယူဆောင်နိုင်သည့် အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်ဖြစ်သောကြောင့်၊ ကျွန်ုပ်တို့သည် k -1 = 3-1 = 2 dummy ကိန်းရှင်များကို ဖန်တီးရန်လိုအပ်ပါသည်။

ဤကိန်းဂဏန်းမပြောင်းလဲနိုင်သောကိန်းရှင်ကို ဖန်တီးရန်အတွက်၊ ကျွန်ုပ်တို့သည် မကြာခဏဆိုသလိုပေါ်လာသောကြောင့် အခြေခံတန်ဖိုးအဖြစ် “ Single” ကို ချန်ထားနိုင်သည်။ ဤသည်မှာ ကျွန်ုပ်တို့သည် အိမ်ထောင်ရေးအခြေအနေအား အတုမရှိသော ကိန်းရှင်များအဖြစ်သို့ မည်သို့ပြောင်းလဲနိုင်မည်နည်း။

ဤသင်ခန်းစာသည် Excel ရှိ ဤအတိအကျဒေတာအတွဲအတွက် dummy variables များကို ဖန်တီးနည်းအဆင့်ဆင့် ဥပမာကို ပေးဆောင်ပြီး ထို dummy variable များကို ကြိုတင်ခန့်မှန်းသူများအဖြစ် အသုံးပြုကာ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ပေးပါသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ပထမဦးစွာ Excel တွင် dataset ကိုဖန်တီးကြပါစို့။

အဆင့် 2: Dummy Variables ကိုဖန်တီးပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် ကော်လံ A နှင့် B မှ တန်ဖိုးများကို ကော်လံ E နှင့် F သို့ကူးယူနိုင်ပြီး၊ ထို့နောက် dummy variable အသစ်နှစ်ခုကို သတ်မှတ်ရန် Excel ရှိ IF() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ- အိမ်ထောင်သည်နှင့် ကွာရှင်းပြတ်စဲသည်။

Excel ရှိ Dummy Variables

ဤသည်မှာ ဆဲလ် G2 တွင် ကျွန်ုပ်တို့အသုံးပြုခဲ့သော ဖော်မြူလာဖြစ်ပြီး၊ ကော်လံ G ရှိ ကျန်ဆဲလ်များသို့ ကျွန်ုပ်တို့ကူးယူထားသော ဖော်မြူလာဖြစ်ပါသည်-

 = IF (C2 = "Married", 1, 0)

ဤတွင် ကျွန်ုပ်တို့သည် ဆဲလ် H2 တွင် ကျွန်ုပ်တို့အသုံးပြုခဲ့သော ဖော်မြူလာဖြစ်ပြီး၊ ကော်လံ H ရှိ ကျန်ဆဲလ်များသို့ ကျွန်ုပ်တို့ကူးယူထားသော ဖော်မြူလာဖြစ်ပါသည်-

 = IF (C2 = "Divorced", 1, 0)

ထို့နောက် ကျွန်ုပ်တို့သည် ဝင်ငွေကိုခန့်မှန်းရန် အဆိုပါကိန်းဂဏန်းများကို ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် အသုံးပြုနိုင်သည်။

အဆင့် 3- Linear Regression လုပ်ဆောင်ပါ။

မျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှုများစွာကို လုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် ထိပ်ဖဲကြိုးတစ်လျှောက်ရှိ ဒေတာ တက်ဘ်ကို နှိပ်ကာ ခွဲခြမ်းစိတ်ဖြာမှု အပိုင်းရှိ ဒေတာခွဲခြမ်းစိတ်ဖြာမှုကို နှိပ်ရန် လိုအပ်သည်-

ဤရွေးချယ်ခွင့်ကို မရရှိနိုင်ပါက၊ Analysis Toolpak ကို ဦးစွာ စတင်ရပါမည်။

ပေါ်လာသည့်ဝင်းဒိုးတွင် Regression ကိုနှိပ်ပြီး OK ကို နှိပ်ပါ။

ထို့နောက် အောက်ပါအချက်အလက်များကိုဖြည့်ပြီး OK ကို နှိပ်ပါ။

Excel ရှိ Regression Dummy Variables

၎င်းသည် အောက်ပါရလဒ်ကို ဖြစ်ပေါ်စေသည်-

Excel တွင် dummy variable များဖြင့် ဆုတ်ယုတ်ခြင်း။

ရလဒ်မှ၊ တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုမျဉ်းသည် အောက်ပါတို့ကို တွေ့ရှိနိုင်သည်။

ဝင်ငွေ = 14,276.12 + 1,471.67*(အသက်) + 2,479.75*(လက်ထပ်) – 8,397.40*(ကွာရှင်း)

လူတစ်ဦးချင်းစီ၏ အသက်အရွယ်နှင့် အိမ်ထောင်ရေးအခြေအနေပေါ်မူတည်၍ လူတစ်ဦးချင်းစီ၏ ခန့်မှန်းဝင်ငွေကို ရှာဖွေရန် ဤညီမျှခြင်းကို အသုံးပြုနိုင်သည်။ ဥပမာအားဖြင့်၊ အသက် 35 နှစ်နှင့် အိမ်ထောင်သည်တစ်ဦးသည် ခန့်မှန်းခြေဝင်ငွေ $68,264 ရှိလိမ့်မည်-

ဝင်ငွေ = 14,276.12 + 1,471.67*(35) + 2,479.75*(1) – 8,397.40*(0) = $68,264

ဤသည်မှာ ဇယားရှိ ဆုတ်ယုတ်မှုကိန်းများကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံဖြစ်သည် ။

  • ကြားဖြတ်- ကြားဖြတ်သည် အသက် သုည လူတစ်ဦး၏ ပျမ်းမျှဝင်ငွေကို ကိုယ်စားပြုသည်။ လူတစ်ဦးသည် အသက် သုညနှစ်မဖြစ်နိုင်သောကြောင့် ဤအထူးဆုတ်ယုတ်မှုပုံစံတွင် ကြားဖြတ်ကို သူ့ဘာသာသူ အဓိပ္ပာယ်ပြန်ဆိုရန် အဓိပ္ပါယ်မရှိပေ။
  • အသက်အရွယ်- အသက်အရွယ် တိုးလာခြင်းသည် တစ်နှစ်လျှင် ပျမ်းမျှဝင်ငွေ $1,471.67 တိုးလာခြင်းနှင့် ဆက်စပ်နေသည်။ p-value (0.004) သည် 0.05 ထက်နည်းသောကြောင့်၊ အသက်သည် ဝင်ငွေ၏ ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ခန့်မှန်းပေးသူဖြစ်သည်။
  • အိမ်ထောင်သည်- အိမ်ထောင်သည်တစ်ဦးသည် တစ်ဦးတစ်ယောက်တည်းထက် ပျမ်းမျှ $2,479.75 ရရှိသည်။ p-value (0.800) သည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤကွာခြားချက်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်မဟုတ်ပါ။
  • ကွာရှင်းပြတ်စဲခြင်း- ကွာရှင်းပြတ်စဲသူတစ်ဦးသည် တစ်ဦးတစ်ယောက်ထက် ပျမ်းမျှ $8,397.40 ရရှိသည်။ p-value (0.532) သည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤကွာခြားချက်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်မဟုတ်ပါ။

ကိန်းဂဏန်းနှစ်ခုလုံးသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားမှုမရှိသောကြောင့်၊ ဝင်ငွေအတွက် ခန့်မှန်းတန်ဖိုးကို ထည့်မထားသည့်ပုံပေါ်သောကြောင့် ကျွန်ုပ်တို့သည် အိမ်ထောင်ရေးအခြေအနေအား ခန့်မှန်းသူအဖြစ် မော်ဒယ်မှ ဖယ်ရှားနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

Excel တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Excel တွင် Residual Sum of Squares တွက်ချက်နည်း
Excel တွင် Polynomial Regression ကို မည်သို့လုပ်ဆောင်မည်နည်း။
Excel တွင် Residual Plot ဖန်တီးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်