Linear regression အတွက် null hypothesis ကို နားလည်ခြင်း။


Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှု variable အကြား ဆက်နွယ်မှုကို နားလည်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။

ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်တစ်ခုနှင့် တုံ့ပြန်မှုကိန်းရှင်တစ်ခုသာရှိလျှင်၊ ကိန်းရှင်များကြားဆက်နွယ်မှုကို ခန့်မှန်းရန် အောက်ပါဖော်မြူလာကိုအသုံးပြုသည့် ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

ŷ = β 0 + β 1 x

ရွှေ-

  • ŷ- ခန့်မှန်းတုံ့ပြန်မှုတန်ဖိုး။
  • β 0 : x သည် သုညဖြစ်သောအခါ y ၏ပျမ်းမျှတန်ဖိုး။
  • β 1 : x တွင် တစ်ယူနစ်တိုးခြင်းနှင့် ဆက်စပ်နေသည့် y ၏ ပျမ်းမျှပြောင်းလဲမှု။
  • x- ကြိုတင်ခန့်မှန်းကိန်းရှင်၏တန်ဖိုး။

ရိုးရှင်းသော linear regression သည် အောက်ပါ null နှင့် အစားထိုး hypotheses ကို အသုံးပြုသည် ။

  • H 0 : β 1 = 0
  • H A : β 1 ≠ 0

null hypothesis တွင် coefficient β 1 သည် သုညနှင့် ညီသည်ဟု ဖော်ပြထားသည်။ တစ်နည်းဆိုရသော် ခန့်မှန်းသူကိန်းရှင် x နှင့် တုံ့ပြန်မှုကိန်းရှင် y တို့ကြားတွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှု မရှိပါ။

အစားထိုးယူဆချက်က β 1 သည် သုညနှင့် မညီမျှ ကြောင်း ဖော်ပြထားသည်။ တစ်နည်းဆိုရသော် x နှင့် y အကြား ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်နွယ်မှု ရှိသည်

ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းကိန်းရှင်များစွာရှိပြီး တုံ့ပြန်မှုကိန်းရှင်တစ်ခုရှိပါက၊ ကိန်းရှင်များကြားရှိဆက်စပ်မှုကို ခန့်မှန်းရန် အောက်ပါဖော်မြူလာကိုအသုံးပြုသည့် မျဉ်းကြောင်းဆုတ်ယုတ်မှုအများအပြားကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

ŷ = β 0 + β 1 x 1 + β 2 x 2 + … + β k x k

ရွှေ-

  • ŷ- ခန့်မှန်းတုံ့ပြန်မှုတန်ဖိုး။
  • β 0 : ခန့်မှန်းသူကိန်းရှင်များအားလုံး သုညနှင့်ညီမျှသောအခါ y ၏ပျမ်းမျှတန်ဖိုး။
  • β i : x i တွင် တစ်ယူနစ်တိုးခြင်းနှင့်ဆက်စပ် y ၏ပျမ်းမျှပြောင်းလဲမှု။
  • x i : ခန့်မှန်းသူ variable x i ၏တန်ဖိုး။

Multiple linear regression သည် အောက်ပါ null နှင့် အစားထိုး hypotheses ကို အသုံးပြုသည် ။

  • H 0 : β 1 = β 2 = … = β k = 0
  • H A : β 1 = β 2 = … = β k ≠ 0

null hypothesis တွင် model ရှိ coefficient အားလုံးသည် သုညနှင့် ညီသည်ဟု ဖော်ပြထားသည်။ တစ်နည်းဆိုရသော်၊ ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် တုံ့ပြန်မှုကိန်းရှင် y နှင့် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်နွယ်မှု မရှိပေ။

အခြားယူဆချက်တစ်ခုက ဖော်ကိန်းအားလုံးသည် သုညနှင့် တပြိုင်နက်တည်းမဟုတ်ဟု ဖော်ပြသည်။

အောက်ဖော်ပြပါနမူနာများသည် ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုနှင့် မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံများစွာတွင် null hypothesis ကို ငြင်းပယ်ခြင်းရှိ၊မရှိ ဆုံးဖြတ်နည်းကိုပြသသည်။

ဥပမာ 1- ရိုးရှင်းသော linear regression

ပါမောက္ခတစ်ယောက်က သူ့အတန်းထဲက ကျောင်းသားတွေ အောင်မြင်မယ့် စာမေးပွဲအဆင့်ကို ခန့်မှန်းဖို့ လေ့လာထားတဲ့ နာရီအရေအတွက်ကို အသုံးပြုလိုတယ်ဆိုပါစို့။ ၎င်းသည် ကျောင်းသား 20 ထံမှ အချက်အလက်များကို စုဆောင်းပြီး ရိုးရှင်းသော linear regression model နှင့် ကိုက်ညီပါသည်။

အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် ဆုတ်ယုတ်မှုပုံစံ၏ ရလဒ်ကို ပြသသည်-

Excel တွင် ရိုးရှင်းသော Linear Regression Output

တပ်ဆင်ထားသော ရိုးရှင်းသော မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံသည်-

စာမေးပွဲရမှတ် = 67.1617 + 5.2503*(စာသင်ချိန်)

လေ့လာသည့်နာရီနှင့် စာမေးပွဲရမှတ်ကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှုရှိမရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ F-တန်ဖိုး နှင့် သက်ဆိုင်သော p-တန်ဖိုးကို ခွဲခြမ်းစိတ်ဖြာရန် လိုအပ်သည်-

  • စုစုပေါင်း F-တန်ဖိုး- 47.9952
  • P-တန်ဖိုး- 0,000

ဤ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်နိုင်ပါသည်။ တစ်နည်းဆိုရသော်၊ လေ့လာသည့်နာရီနှင့် စာမေးပွဲရမှတ်များကြားတွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်ဆံရေးရှိသည်။

ဥပမာ 2- Multiple linear regression

ပရော်ဖက်ဆာတစ်ဦးသည် အတန်းထဲတွင် အတန်းကျောင်းသားများ ဝင်ငွေရရှိမည်ဟု ခန့်မှန်းရန်အတွက် ပါမောက္ခတစ်ဦးသည် လေ့လာသည့် နာရီအရေအတွက်နှင့် ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲအရေအတွက်ကို အသုံးပြုလိုသည်ဆိုပါစို့။ ၎င်းသည် ကျောင်းသား 20 ထံမှ ဒေတာကို စုဆောင်းပြီး မျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှု ပုံစံမျိုးစုံနှင့် ကိုက်ညီပါသည်။

အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် ဆုတ်ယုတ်မှုပုံစံ၏ ရလဒ်ကို ပြသသည်-

Excel တွင် Multiple Linear Regression Output

တပ်ဆင်ထားသော multiple linear regression model သည်-

စာမေးပွဲရမှတ် = 67.67 + 5.56*(စာသင်ချိန်) – 0.60*(ကြိုတင် စာမေးပွဲများ)

ခန့်မှန်းသူကိန်းရှင်နှစ်ခုနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြားတွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှုရှိမရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ F တန်ဖိုးနှင့် သက်ဆိုင်သော p တန်ဖိုးကို ပိုင်းခြားစိတ်ဖြာရန် လိုအပ်သည်-

  • စုစုပေါင်း F-တန်ဖိုး- 23.46
  • P-တန်ဖိုး- 0.00

ဤ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်နိုင်ပါသည်။ တစ်နည်းဆိုရသော် သင်ကြားသည့် နာရီများနှင့် ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲများသည် စာမေးပွဲရလဒ်များနှင့် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်စပ်မှုရှိသည်။

မှတ်ချက်- ကြိုတင်ပြင်ဆင်စာမေးပွဲများအတွက် p-တန်ဖိုး (p = 0.52) သည် သိသာထင်ရှားခြင်းမရှိသော်လည်း လေ့လာထားသည့်နာရီများနှင့် ပေါင်းစပ်ထားသော ကြိုတင်ပြင်ဆင်မှုစာမေးပွဲများသည် စာမေးပွဲရလဒ်များနှင့် သိသိသာသာ ဆက်စပ်မှုရှိနေသည်။

ထပ်လောင်းအရင်းအမြစ်များ

ဆုတ်ယုတ်မှုတွင် ယေဘုယျသိသာထင်ရှားမှုများအတွက် F Test ကို နားလည်ခြင်း။
Regression Table ကို ဘယ်လိုဖတ်ပြီး အဓိပါယ်ရမလဲ
ဆုတ်ယုတ်မှုရလဒ်များကို မည်သို့အစီရင်ခံမည်နည်း။
Excel တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Excel တွင် linear regression အများအပြားလုပ်ဆောင်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်