Excel တွင် dummy variable များဖန်တီးနည်း (အဆင့်ဆင့်)
dummy variable သည် regression ခွဲခြမ်းစိတ်ဖြာမှုတွင် ကျွန်ုပ်တို့ဖန်တီးထားသော variable အမျိုးအစားတစ်ခုဖြစ်ပြီး တန်ဖိုးနှစ်ခုမှ တစ်ခုဖြစ်သော သုည သို့မဟုတ် တစ်ခုအား ကိန်းဂဏာန်းကိန်းရှင်အဖြစ် categorical variable အဖြစ် ကိုယ်စားပြုနိုင်စေရန်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိပြီး ဝင်ငွေကို ခန့်မှန်းရန် အသက်အရွယ် နှင့် အိမ်ထောင်ရေးအဆင့်အတန်းကို အသုံးပြုလိုသည်ဆိုပါစို့။
ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ အိမ်ထောင်ရေးအခြေအနေအား ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်အဖြစ် အသုံးပြုရန်၊ ၎င်းကို အတုမဲ့ကိန်းရှင်အဖြစ် ပြောင်းလဲရန် လိုအပ်သည်။
၎င်းသည် လောလောဆယ်တွင် မတူညီသောတန်ဖိုး (“ လူပျို” ၊ “ အိမ်ထောင်သည်” သို့မဟုတ် “ ကွာရှင်းသည်” ) တွင် မတူညီသောတန်ဖိုးသုံးခုကိုယူဆောင်နိုင်သည့် အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်ဖြစ်သောကြောင့်၊ ကျွန်ုပ်တို့သည် k -1 = 3-1 = 2 dummy ကိန်းရှင်များကို ဖန်တီးရန်လိုအပ်ပါသည်။
ဤကိန်းဂဏန်းမပြောင်းလဲနိုင်သောကိန်းရှင်ကို ဖန်တီးရန်အတွက်၊ ကျွန်ုပ်တို့သည် မကြာခဏဆိုသလိုပေါ်လာသောကြောင့် အခြေခံတန်ဖိုးအဖြစ် “ Single” ကို ချန်ထားနိုင်သည်။ ဤသည်မှာ ကျွန်ုပ်တို့သည် အိမ်ထောင်ရေးအခြေအနေအား အတုမရှိသော ကိန်းရှင်များအဖြစ်သို့ မည်သို့ပြောင်းလဲနိုင်မည်နည်း။
ဤသင်ခန်းစာသည် Excel ရှိ ဤအတိအကျဒေတာအတွဲအတွက် dummy variables များကို ဖန်တီးနည်းအဆင့်ဆင့် ဥပမာကို ပေးဆောင်ပြီး ထို dummy variable များကို ကြိုတင်ခန့်မှန်းသူများအဖြစ် အသုံးပြုကာ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ပေးပါသည်။
အဆင့် 1: ဒေတာကိုဖန်တီးပါ။
ပထမဦးစွာ Excel တွင် dataset ကိုဖန်တီးကြပါစို့။
အဆင့် 2: Dummy Variables ကိုဖန်တီးပါ။
ထို့နောက်၊ ကျွန်ုပ်တို့သည် ကော်လံ A နှင့် B မှ တန်ဖိုးများကို ကော်လံ E နှင့် F သို့ကူးယူနိုင်ပြီး၊ ထို့နောက် dummy variable အသစ်နှစ်ခုကို သတ်မှတ်ရန် Excel ရှိ IF() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ- အိမ်ထောင်သည်နှင့် ကွာရှင်းပြတ်စဲသည်။
ဤသည်မှာ ဆဲလ် G2 တွင် ကျွန်ုပ်တို့အသုံးပြုခဲ့သော ဖော်မြူလာဖြစ်ပြီး၊ ကော်လံ G ရှိ ကျန်ဆဲလ်များသို့ ကျွန်ုပ်တို့ကူးယူထားသော ဖော်မြူလာဖြစ်ပါသည်-
= IF (C2 = "Married", 1, 0)
ဤတွင် ကျွန်ုပ်တို့သည် ဆဲလ် H2 တွင် ကျွန်ုပ်တို့အသုံးပြုခဲ့သော ဖော်မြူလာဖြစ်ပြီး၊ ကော်လံ H ရှိ ကျန်ဆဲလ်များသို့ ကျွန်ုပ်တို့ကူးယူထားသော ဖော်မြူလာဖြစ်ပါသည်-
= IF (C2 = "Divorced", 1, 0)
ထို့နောက် ကျွန်ုပ်တို့သည် ဝင်ငွေကိုခန့်မှန်းရန် အဆိုပါကိန်းဂဏန်းများကို ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် အသုံးပြုနိုင်သည်။
အဆင့် 3- Linear Regression လုပ်ဆောင်ပါ။
မျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှုများစွာကို လုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် ထိပ်ဖဲကြိုးတစ်လျှောက်ရှိ ဒေတာ တက်ဘ်ကို နှိပ်ကာ ခွဲခြမ်းစိတ်ဖြာမှု အပိုင်းရှိ ဒေတာခွဲခြမ်းစိတ်ဖြာမှုကို နှိပ်ရန် လိုအပ်သည်-
ဤရွေးချယ်ခွင့်ကို မရရှိနိုင်ပါက၊ Analysis Toolpak ကို ဦးစွာ စတင်ရပါမည်။
ပေါ်လာသည့်ဝင်းဒိုးတွင် Regression ကိုနှိပ်ပြီး OK ကို နှိပ်ပါ။
ထို့နောက် အောက်ပါအချက်အလက်များကိုဖြည့်ပြီး OK ကို နှိပ်ပါ။
၎င်းသည် အောက်ပါရလဒ်ကို ဖြစ်ပေါ်စေသည်-
ရလဒ်မှ၊ တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုမျဉ်းသည် အောက်ပါတို့ကို တွေ့ရှိနိုင်သည်။
ဝင်ငွေ = 14,276.12 + 1,471.67*(အသက်) + 2,479.75*(လက်ထပ်) – 8,397.40*(ကွာရှင်း)
လူတစ်ဦးချင်းစီ၏ အသက်အရွယ်နှင့် အိမ်ထောင်ရေးအခြေအနေပေါ်မူတည်၍ လူတစ်ဦးချင်းစီ၏ ခန့်မှန်းဝင်ငွေကို ရှာဖွေရန် ဤညီမျှခြင်းကို အသုံးပြုနိုင်သည်။ ဥပမာအားဖြင့်၊ အသက် 35 နှစ်နှင့် အိမ်ထောင်သည်တစ်ဦးသည် ခန့်မှန်းခြေဝင်ငွေ $68,264 ရှိလိမ့်မည်-
ဝင်ငွေ = 14,276.12 + 1,471.67*(35) + 2,479.75*(1) – 8,397.40*(0) = $68,264
ဤသည်မှာ ဇယားရှိ ဆုတ်ယုတ်မှုကိန်းများကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံဖြစ်သည် ။
- ကြားဖြတ်- ကြားဖြတ်သည် အသက် သုည လူတစ်ဦး၏ ပျမ်းမျှဝင်ငွေကို ကိုယ်စားပြုသည်။ လူတစ်ဦးသည် အသက် သုညနှစ်မဖြစ်နိုင်သောကြောင့် ဤအထူးဆုတ်ယုတ်မှုပုံစံတွင် ကြားဖြတ်ကို သူ့ဘာသာသူ အဓိပ္ပာယ်ပြန်ဆိုရန် အဓိပ္ပါယ်မရှိပေ။
- အသက်အရွယ်- အသက်အရွယ် တိုးလာခြင်းသည် တစ်နှစ်လျှင် ပျမ်းမျှဝင်ငွေ $1,471.67 တိုးလာခြင်းနှင့် ဆက်စပ်နေသည်။ p-value (0.004) သည် 0.05 ထက်နည်းသောကြောင့်၊ အသက်သည် ဝင်ငွေ၏ ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ခန့်မှန်းပေးသူဖြစ်သည်။
- အိမ်ထောင်သည်- အိမ်ထောင်သည်တစ်ဦးသည် တစ်ဦးတစ်ယောက်တည်းထက် ပျမ်းမျှ $2,479.75 ရရှိသည်။ p-value (0.800) သည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤကွာခြားချက်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်မဟုတ်ပါ။
- ကွာရှင်းပြတ်စဲခြင်း- ကွာရှင်းပြတ်စဲသူတစ်ဦးသည် တစ်ဦးတစ်ယောက်ထက် ပျမ်းမျှ $8,397.40 ရရှိသည်။ p-value (0.532) သည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤကွာခြားချက်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်မဟုတ်ပါ။
ကိန်းဂဏန်းနှစ်ခုလုံးသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားမှုမရှိသောကြောင့်၊ ဝင်ငွေအတွက် ခန့်မှန်းတန်ဖိုးကို ထည့်မထားသည့်ပုံပေါ်သောကြောင့် ကျွန်ုပ်တို့သည် အိမ်ထောင်ရေးအခြေအနေအား ခန့်မှန်းသူအဖြစ် မော်ဒယ်မှ ဖယ်ရှားနိုင်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
Excel တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Excel တွင် Residual Sum of Squares တွက်ချက်နည်း
Excel တွင် Polynomial Regression ကို မည်သို့လုပ်ဆောင်မည်နည်း။
Excel တွင် Residual Plot ဖန်တီးနည်း