တစ်ပြေးညီ ဆုတ်ယုတ်မှု

ဤဆောင်းပါးတွင် linear regression သည် အဘယ်အရာနှင့် ၎င်းကို ကိန်းဂဏန်းများအတွက် အသုံးပြုကြောင်း ရှင်းပြထားသည်။ ထို့အပြင်၊ linear regression အမျိုးအစား နှစ်ခုကို မည်ကဲ့သို့ တွက်ချက်ထားသည်- ရိုးရှင်းသော linear regression နှင့် multiple linear regression ကို သင်တွေ့မြင်နိုင်မည်ဖြစ်ပါသည်။

linear regression ဆိုတာ ဘာလဲ။

Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော အမှီအခိုကင်းသော variable များကို မှီခိုသော variable နှင့် ဆက်စပ်နေသော ကိန်းဂဏန်းစံနမူနာတစ်ခုဖြစ်သည်။ ရိုးရိုးရှင်းရှင်းပြောရလျှင် linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော explanatory variables နှင့် response variable အကြား ဆက်နွယ်မှုကို ခန့်မှန်းသည့် ညီမျှခြင်းတစ်ခုကို ရှာဖွေရန် အသုံးပြုသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။

ဥပမာအားဖြင့်၊ ညီမျှခြင်း y=2+5x 1 -3x 2 +8x 3 သည် အမှီအခိုကင်းသော variable သုံးခု (x 1 , x 2 , x 3 ) တို့ကို သင်္ချာနည်းအရ ဆက်စပ်ကိန်းရှင် (y) နှင့် ဆက်နွယ်နေသောကြောင့်၊ variable များကြား ဆက်စပ်မှုသည် linear ဖြစ်သည်။

Linear Regression အမျိုးအစားများ

linear regression ဟူ၍ နှစ်မျိုးရှိ သည်။

  • ရိုးရှင်းသော linear regression : အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခုသည် မှီခိုကိန်းရှင်တစ်ခုနှင့် ချိတ်ဆက်ထားသည်။ ဤမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံအတွက် ညီမျှခြင်းသည် y=β 01 x 1 ပုံစံဖြစ်သည်။
  • Multiple linear regression : regression model တွင် ရှင်းလင်းချက်ပြောင်းနိုင်သော variable များနှင့် တုံ့ပြန်မှု variable များစွာရှိသည်။ ထို့ကြောင့်၊ ဤမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ၏ ညီမျှခြင်းသည် y=β 01 x 12 x 2 …+β m x m ပုံစံဖြစ်သည်။

ရိုးရှင်းသော linear ဆုတ်ယုတ်မှု

ရိုးရှင်းသော linear regression ကို variable နှစ်ခုလုံးနှင့် သီးခြားလွတ်လပ်သော variable တစ်ခုကို ဆက်စပ်ရန် အသုံးပြုသည်။

ရိုးရှင်းသော linear regression model ၏ ညီမျှခြင်းသည် မျဉ်းဖြောင့်ဖြစ်ပြီး၊ ထို့ကြောင့် ၎င်းကို coefficients နှစ်ခုဖြင့် ဖွဲ့စည်းထားသည်- ညီမျှခြင်း (β 0 ) နှင့် variable နှစ်ခုကြားရှိ ဆက်စပ်ကိန်း (β 1 )။ ထို့ကြောင့်၊ ရိုးရှင်းသော linear regression model အတွက် ညီမျှခြင်းမှာ y=β 01 x ဖြစ်သည်။

y=\beta_0+\beta_1x

ရိုးရှင်းသော linear regression coefficients များကို တွက်ချက်ရန်အတွက် ဖော်မြူလာများမှာ အောက်ပါအတိုင်းဖြစ်သည် ။

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

ရွှေ-

  • \beta_0

    regression line ၏ ကိန်းသေဖြစ်ပါသည်။

  • \beta_1

    regression line ၏ slope ဖြစ်သည်။

  • x_i

    ဒေတာ i ၏ လွတ်လပ်သော ကိန်းရှင် X ၏ တန်ဖိုးဖြစ်သည်။

  • y_i

    ဒေတာ i ၏ မှီခို variable Y ၏ တန်ဖိုးဖြစ်သည်။

  • \overline{x}

    လွတ်လပ်သော variable ၏ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။

  • \overline{y}

    dependent variable Y ၏ ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။

မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား

Multiple linear regression model တစ်ခုတွင်၊ အနည်းဆုံး သီးခြားသော ကိန်းရှင်နှစ်ခု ပါဝင်ပါသည်။ တစ်နည်းဆိုရသော် Multiple linear regression သည် များစွာသော explanatory variable များကို တုံ့ပြန်မှု variable နှင့် linearly ချိတ်ဆက်နိုင်စေပါသည်။

Multiple linear regression model အတွက် ညီမျှခြင်းမှာ y=β 01 x 12 x 2 +…+β m x m +ε ဖြစ်သည်။

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

ရွှေ-

  • y

    dependent variable ဖြစ်ပါတယ်။

  • x_i

    လွတ်လပ်သော ကိန်းရှင် i ဖြစ်သည် ။

  • \beta_0

    Multiple linear regression equation ၏ ကိန်းသေဖြစ်ပါသည်။

  • \beta_i

    ကိန်းရှင်နှင့်ဆက်စပ်နေသော ဆုတ်ယုတ်မှုကိန်းဂဏန်းဖြစ်သည်။

    x_i

    .

  • \bm{\varepsilon}

    error သို့မဟုတ် residual ဖြစ်သည်၊ ဆိုလိုသည်မှာ သတိပြုမိသောတန်ဖိုးနှင့် မော်ဒယ်မှ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ကို ဆိုလိုသည်။

  • m

    မော်ဒယ်ရှိ ကိန်းရှင်များ စုစုပေါင်း အရေအတွက် ဖြစ်ပါသည်။

ဒီတော့ စုစုပေါင်းနမူနာတစ်ခုရရင်

n

လေ့လာချက်များအရ၊ ကျွန်ုပ်တို့သည် မျဉ်းကြောင်းကြောင်း ဆုတ်ယုတ်မှုပုံစံကို မက်ထရစ်ပုံစံဖြင့် ပုံဖော်နိုင်သည်-

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

အထက်ဖော်ပြပါ မက်ထရစ်အသုံးအနှုန်းကို မက်ထရစ်တစ်ခုစီသို့ စာလုံးတစ်လုံးစီ သတ်မှတ်ခြင်းဖြင့် ပြန်လည်ရေးသားနိုင်သည်-

Y=X\beta+\varepsilon

ထို့ကြောင့်၊ အနည်းဆုံး စတုရန်းစံသတ်မှတ်ချက်ကို ကျင့်သုံးခြင်းဖြင့်၊ များစွာသော မျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ၏ ကိန်းဂဏန်းများကို ခန့်မှန်းရန် ဖော်မြူလာ သို့ ကျွန်ုပ်တို့ ရောက်ရှိနိုင်သည်-

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

သို့သော်၊ ဤဖော်မြူလာ၏အသုံးချမှုသည် အလွန်ပင်ပန်းပြီး အချိန်ကုန်သောကြောင့် လက်တွေ့တွင် Multiple regression model ကိုပိုမိုလျင်မြန်စွာဖန်တီးနိုင်သည့် ကွန်ပျူတာဆော့ဖ်ဝဲ (ဥပမာ Minitab သို့မဟုတ် Excel) ကို အသုံးပြုရန် အကြံပြုထားသည်။

Linear Regression ယူဆချက်

linear regression model တွင်၊ model မှန်ကန်စေရန်အတွက် အောက်ပါအခြေအနေများနှင့် ကိုက်ညီရမည်-

  • လွတ်လပ်ရေး – အကြွင်းအကျန်များသည် တစ်ခုနှင့်တစ်ခု အမှီအခိုကင်းရမည်။ စံပြလွတ်လပ်မှုကို သေချာစေရန် ဘုံနည်းလမ်းမှာ နမူနာကောက်ယူခြင်းလုပ်ငန်းစဉ်တွင် ကျပန်းထည့်သွင်းခြင်းဖြစ်ပါသည်။
  • Homoscedasticity : အကြွင်းအကျန်များ၏ ကွဲလွဲမှုများတွင် တူညီမှုရှိရမည်၊ ဆိုလိုသည်မှာ အကြွင်းအကျန်များ၏ ကွဲလွဲမှုမှာ စဉ်ဆက်မပြတ်ရှိနေရမည်ဖြစ်သည်။
  • Multicollinearity မဟုတ်သော- မော်ဒယ်တွင်ပါရှိသော ရှင်းလင်းချက် ကိန်းရှင်များသည် တစ်ခုနှင့်တစ်ခု ချိတ်ဆက်၍မရပါ သို့မဟုတ် အနည်းဆုံး ၎င်းတို့၏ဆက်ဆံရေးသည် အလွန်အားနည်းနေရပါမည်။
  • Normality : ကျန်ရှိသောပစ္စည်းများကို ပုံမှန်ဖြန့်ဝေရပါမည် သို့မဟုတ် တစ်နည်းအားဖြင့်ဆိုလိုရင်း 0 ဖြင့် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လုပ်ဆောင်ရမည်ဖြစ်သည်။
  • Linearity : တုံ့ပြန်မှု variable နှင့် explanatory variables အကြား ဆက်နွယ်မှုသည် linear ဖြစ်သည်ဟု ယူဆပါသည်။

linear regression ကို ဘာအတွက်အသုံးပြုသလဲ။

Linear regression တွင် အခြေခံအားဖြင့် အသုံးပြုမှု နှစ်ခုရှိသည်- Linear regression ကို explanatory variables နှင့် response variable အကြား ဆက်နွယ်မှုကို ရှင်းပြရန် အသုံးပြုပြီး အလားတူ၊ linear regression ကို လေ့လာမှုအသစ်အတွက် dependent variable ၏တန်ဖိုးကို ခန့်မှန်းရန် အသုံးပြုပါသည်။

linear regression model ၏ ညီမျှခြင်းကို ရယူခြင်းဖြင့်၊ model ရှိ variables များကြားတွင် ဆက်စပ်မှု အမျိုးအစားကို သိရှိနိုင်ပါသည်။ အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခု၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အပေါင်းလက္ခဏာဖြစ်ပါက၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါတွင် တိုးလာမည်ဖြစ်သည်။ အမှီအခိုကင်းသောကိန်းရှင်တစ်ခု၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အနုတ်ဖြစ်နေပါက၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါ လျော့နည်းသွားမည်ဖြစ်သည်။

တစ်ဖက်တွင်၊ linear regression တွင် တွက်ချက်ထားသော equation သည် value ခန့်မှန်းချက်များကို ပြုလုပ်နိုင်သည်။ ထို့ကြောင့်၊ စံပြညီမျှခြင်းသို့ explanatory variable များ၏ တန်ဖိုးများကို မိတ်ဆက်ပေးခြင်းဖြင့် data အသစ်တစ်ခုအတွက် dependent variable ၏တန်ဖိုးကို တွက်ချက်နိုင်ပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်