Linear regression အတွက် null hypothesis ကို နားလည်ခြင်း။
Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှု variable အကြား ဆက်နွယ်မှုကို နားလည်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။
ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်တစ်ခုနှင့် တုံ့ပြန်မှုကိန်းရှင်တစ်ခုသာရှိလျှင်၊ ကိန်းရှင်များကြားဆက်နွယ်မှုကို ခန့်မှန်းရန် အောက်ပါဖော်မြူလာကိုအသုံးပြုသည့် ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
ŷ = β 0 + β 1 x
ရွှေ-
- ŷ- ခန့်မှန်းတုံ့ပြန်မှုတန်ဖိုး။
- β 0 : x သည် သုညဖြစ်သောအခါ y ၏ပျမ်းမျှတန်ဖိုး။
- β 1 : x တွင် တစ်ယူနစ်တိုးခြင်းနှင့် ဆက်စပ်နေသည့် y ၏ ပျမ်းမျှပြောင်းလဲမှု။
- x- ကြိုတင်ခန့်မှန်းကိန်းရှင်၏တန်ဖိုး။
ရိုးရှင်းသော linear regression သည် အောက်ပါ null နှင့် အစားထိုး hypotheses ကို အသုံးပြုသည် ။
- H 0 : β 1 = 0
- H A : β 1 ≠ 0
null hypothesis တွင် coefficient β 1 သည် သုညနှင့် ညီသည်ဟု ဖော်ပြထားသည်။ တစ်နည်းဆိုရသော် ခန့်မှန်းသူကိန်းရှင် x နှင့် တုံ့ပြန်မှုကိန်းရှင် y တို့ကြားတွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှု မရှိပါ။
အစားထိုးယူဆချက်က β 1 သည် သုညနှင့် မညီမျှ ကြောင်း ဖော်ပြထားသည်။ တစ်နည်းဆိုရသော် x နှင့် y အကြား ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်နွယ်မှု ရှိသည် ။
ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းကိန်းရှင်များစွာရှိပြီး တုံ့ပြန်မှုကိန်းရှင်တစ်ခုရှိပါက၊ ကိန်းရှင်များကြားရှိဆက်စပ်မှုကို ခန့်မှန်းရန် အောက်ပါဖော်မြူလာကိုအသုံးပြုသည့် မျဉ်းကြောင်းဆုတ်ယုတ်မှုအများအပြားကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
ŷ = β 0 + β 1 x 1 + β 2 x 2 + … + β k x k
ရွှေ-
- ŷ- ခန့်မှန်းတုံ့ပြန်မှုတန်ဖိုး။
- β 0 : ခန့်မှန်းသူကိန်းရှင်များအားလုံး သုညနှင့်ညီမျှသောအခါ y ၏ပျမ်းမျှတန်ဖိုး။
- β i : x i တွင် တစ်ယူနစ်တိုးခြင်းနှင့်ဆက်စပ် y ၏ပျမ်းမျှပြောင်းလဲမှု။
- x i : ခန့်မှန်းသူ variable x i ၏တန်ဖိုး။
Multiple linear regression သည် အောက်ပါ null နှင့် အစားထိုး hypotheses ကို အသုံးပြုသည် ။
- H 0 : β 1 = β 2 = … = β k = 0
- H A : β 1 = β 2 = … = β k ≠ 0
null hypothesis တွင် model ရှိ coefficient အားလုံးသည် သုညနှင့် ညီသည်ဟု ဖော်ပြထားသည်။ တစ်နည်းဆိုရသော်၊ ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် တုံ့ပြန်မှုကိန်းရှင် y နှင့် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်နွယ်မှု မရှိပေ။
အခြားယူဆချက်တစ်ခုက ဖော်ကိန်းအားလုံးသည် သုညနှင့် တပြိုင်နက်တည်းမဟုတ်ဟု ဖော်ပြသည်။
အောက်ဖော်ပြပါနမူနာများသည် ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုနှင့် မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံများစွာတွင် null hypothesis ကို ငြင်းပယ်ခြင်းရှိ၊မရှိ ဆုံးဖြတ်နည်းကိုပြသသည်။
ဥပမာ 1- ရိုးရှင်းသော linear regression
ပါမောက္ခတစ်ယောက်က သူ့အတန်းထဲက ကျောင်းသားတွေ အောင်မြင်မယ့် စာမေးပွဲအဆင့်ကို ခန့်မှန်းဖို့ လေ့လာထားတဲ့ နာရီအရေအတွက်ကို အသုံးပြုလိုတယ်ဆိုပါစို့။ ၎င်းသည် ကျောင်းသား 20 ထံမှ အချက်အလက်များကို စုဆောင်းပြီး ရိုးရှင်းသော linear regression model နှင့် ကိုက်ညီပါသည်။
အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် ဆုတ်ယုတ်မှုပုံစံ၏ ရလဒ်ကို ပြသသည်-
တပ်ဆင်ထားသော ရိုးရှင်းသော မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံသည်-
စာမေးပွဲရမှတ် = 67.1617 + 5.2503*(စာသင်ချိန်)
လေ့လာသည့်နာရီနှင့် စာမေးပွဲရမှတ်ကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှုရှိမရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ F-တန်ဖိုး နှင့် သက်ဆိုင်သော p-တန်ဖိုးကို ခွဲခြမ်းစိတ်ဖြာရန် လိုအပ်သည်-
- စုစုပေါင်း F-တန်ဖိုး- 47.9952
- P-တန်ဖိုး- 0,000
ဤ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်နိုင်ပါသည်။ တစ်နည်းဆိုရသော်၊ လေ့လာသည့်နာရီနှင့် စာမေးပွဲရမှတ်များကြားတွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်ဆံရေးရှိသည်။
ဥပမာ 2- Multiple linear regression
ပရော်ဖက်ဆာတစ်ဦးသည် အတန်းထဲတွင် အတန်းကျောင်းသားများ ဝင်ငွေရရှိမည်ဟု ခန့်မှန်းရန်အတွက် ပါမောက္ခတစ်ဦးသည် လေ့လာသည့် နာရီအရေအတွက်နှင့် ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲအရေအတွက်ကို အသုံးပြုလိုသည်ဆိုပါစို့။ ၎င်းသည် ကျောင်းသား 20 ထံမှ ဒေတာကို စုဆောင်းပြီး မျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှု ပုံစံမျိုးစုံနှင့် ကိုက်ညီပါသည်။
အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် ဆုတ်ယုတ်မှုပုံစံ၏ ရလဒ်ကို ပြသသည်-
တပ်ဆင်ထားသော multiple linear regression model သည်-
စာမေးပွဲရမှတ် = 67.67 + 5.56*(စာသင်ချိန်) – 0.60*(ကြိုတင် စာမေးပွဲများ)
ခန့်မှန်းသူကိန်းရှင်နှစ်ခုနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြားတွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှုရှိမရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ F တန်ဖိုးနှင့် သက်ဆိုင်သော p တန်ဖိုးကို ပိုင်းခြားစိတ်ဖြာရန် လိုအပ်သည်-
- စုစုပေါင်း F-တန်ဖိုး- 23.46
- P-တန်ဖိုး- 0.00
ဤ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်နိုင်ပါသည်။ တစ်နည်းဆိုရသော် သင်ကြားသည့် နာရီများနှင့် ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲများသည် စာမေးပွဲရလဒ်များနှင့် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်စပ်မှုရှိသည်။
မှတ်ချက်- ကြိုတင်ပြင်ဆင်စာမေးပွဲများအတွက် p-တန်ဖိုး (p = 0.52) သည် သိသာထင်ရှားခြင်းမရှိသော်လည်း လေ့လာထားသည့်နာရီများနှင့် ပေါင်းစပ်ထားသော ကြိုတင်ပြင်ဆင်မှုစာမေးပွဲများသည် စာမေးပွဲရလဒ်များနှင့် သိသိသာသာ ဆက်စပ်မှုရှိနေသည်။
ထပ်လောင်းအရင်းအမြစ်များ
ဆုတ်ယုတ်မှုတွင် ယေဘုယျသိသာထင်ရှားမှုများအတွက် F Test ကို နားလည်ခြင်း။
Regression Table ကို ဘယ်လိုဖတ်ပြီး အဓိပါယ်ရမလဲ
ဆုတ်ယုတ်မှုရလဒ်များကို မည်သို့အစီရင်ခံမည်နည်း။
Excel တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Excel တွင် linear regression အများအပြားလုပ်ဆောင်နည်း