တစ်ပြေးညီ ဆုတ်ယုတ်မှု

အားဖြင့် Benjamin Anderson ဩဂုတ် 2, 2023 စာရင်းအင်းများ 0 မှတ်ချက်များ

ဤဆောင်းပါးတွင် linear regression သည် အဘယ်အရာနှင့် ၎င်းကို ကိန်းဂဏန်းများအတွက် အသုံးပြုကြောင်း ရှင်းပြထားသည်။ ထို့အပြင်၊ linear regression အမျိုးအစား နှစ်ခုကို မည်ကဲ့သို့ တွက်ချက်ထားသည်- ရိုးရှင်းသော linear regression နှင့် multiple linear regression ကို သင်တွေ့မြင်နိုင်မည်ဖြစ်ပါသည်။

linear regression ဆိုတာ ဘာလဲ။

Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော အမှီအခိုကင်းသော variable များကို မှီခိုသော variable နှင့် ဆက်စပ်နေသော ကိန်းဂဏန်းစံနမူနာတစ်ခုဖြစ်သည်။ ရိုးရိုးရှင်းရှင်းပြောရလျှင် linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော explanatory variables နှင့် response variable အကြား ဆက်နွယ်မှုကို ခန့်မှန်းသည့် ညီမျှခြင်းတစ်ခုကို ရှာဖွေရန် အသုံးပြုသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။

ဥပမာအားဖြင့်၊ ညီမျှခြင်း y=2+5x ₁ -3x ₂ +8x ₃ သည် အမှီအခိုကင်းသော variable သုံးခု (x ₁ , x ₂ , x ₃ ) တို့ကို သင်္ချာနည်းအရ ဆက်စပ်ကိန်းရှင် (y) နှင့် ဆက်နွယ်နေသောကြောင့်၊ variable များကြား ဆက်စပ်မှုသည် linear ဖြစ်သည်။

Linear Regression အမျိုးအစားများ

linear regression ဟူ၍ နှစ်မျိုးရှိ သည်။

ရိုးရှင်းသော linear regression : အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခုသည် မှီခိုကိန်းရှင်တစ်ခုနှင့် ချိတ်ဆက်ထားသည်။ ဤမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံအတွက် ညီမျှခြင်းသည် y=β ₀ +β ₁ x ₁ ပုံစံဖြစ်သည်။
Multiple linear regression : regression model တွင် ရှင်းလင်းချက်ပြောင်းနိုင်သော variable များနှင့် တုံ့ပြန်မှု variable များစွာရှိသည်။ ထို့ကြောင့်၊ ဤမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ၏ ညီမျှခြင်းသည် y=β ₀ +β ₁ x ₁ +β ₂ x ₂ …+β _m x _m ပုံစံဖြစ်သည်။

ရိုးရှင်းသော linear ဆုတ်ယုတ်မှု

ရိုးရှင်းသော linear regression ကို variable နှစ်ခုလုံးနှင့် သီးခြားလွတ်လပ်သော variable တစ်ခုကို ဆက်စပ်ရန် အသုံးပြုသည်။

ရိုးရှင်းသော linear regression model ၏ ညီမျှခြင်းသည် မျဉ်းဖြောင့်ဖြစ်ပြီး၊ ထို့ကြောင့် ၎င်းကို coefficients နှစ်ခုဖြင့် ဖွဲ့စည်းထားသည်- ညီမျှခြင်း (β ₀ ) နှင့် variable နှစ်ခုကြားရှိ ဆက်စပ်ကိန်း (β ₁ )။ ထို့ကြောင့်၊ ရိုးရှင်းသော linear regression model အတွက် ညီမျှခြင်းမှာ y=β ₀ +β ₁ x ဖြစ်သည်။

$y=\beta_0+\beta_1x$

ရိုးရှင်းသော linear regression coefficients များကို တွက်ချက်ရန်အတွက် ဖော်မြူလာများမှာ အောက်ပါအတိုင်းဖြစ်သည် ။

$\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}$

ရွှေ-

$\beta_0$

regression line ၏ ကိန်းသေဖြစ်ပါသည်။
$\beta_1$

regression line ၏ slope ဖြစ်သည်။
$x_i$

ဒေတာ i ၏ လွတ်လပ်သော ကိန်းရှင် X ၏ တန်ဖိုးဖြစ်သည်။
$y_i$

ဒေတာ i ၏ မှီခို variable Y ၏ တန်ဖိုးဖြစ်သည်။
$\overline{x}$

လွတ်လပ်သော variable ၏ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။
$\overline{y}$

dependent variable Y ၏ ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။

➤ ရိုးရှင်းသော မျဉ်းကြောင်းဆုတ်ယုတ်မှု၏ ခိုင်မာသော ဥပမာကို ကြည့်ပါ။

မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား

Multiple linear regression model တစ်ခုတွင်၊ အနည်းဆုံး သီးခြားသော ကိန်းရှင်နှစ်ခု ပါဝင်ပါသည်။ တစ်နည်းဆိုရသော် Multiple linear regression သည် များစွာသော explanatory variable များကို တုံ့ပြန်မှု variable နှင့် linearly ချိတ်ဆက်နိုင်စေပါသည်။

Multiple linear regression model အတွက် ညီမျှခြင်းမှာ y=β ₀ +β ₁ x ₁ +β ₂ x ₂ +…+β _m x _m +ε ဖြစ်သည်။

$y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon$

ရွှေ-

$y$

dependent variable ဖြစ်ပါတယ်။
$x_i$

လွတ်လပ်သော ကိန်းရှင် i ဖြစ်သည် ။
$\beta_0$

Multiple linear regression equation ၏ ကိန်းသေဖြစ်ပါသည်။
$\beta_i$

ကိန်းရှင်နှင့်ဆက်စပ်နေသော ဆုတ်ယုတ်မှုကိန်းဂဏန်းဖြစ်သည်။

$x_i$

.
$\bm{\varepsilon}$

error သို့မဟုတ် residual ဖြစ်သည်၊ ဆိုလိုသည်မှာ သတိပြုမိသောတန်ဖိုးနှင့် မော်ဒယ်မှ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ကို ဆိုလိုသည်။
$m$

မော်ဒယ်ရှိ ကိန်းရှင်များ စုစုပေါင်း အရေအတွက် ဖြစ်ပါသည်။

ဒီတော့ စုစုပေါင်းနမူနာတစ်ခုရရင်

$n$

လေ့လာချက်များအရ၊ ကျွန်ုပ်တို့သည် မျဉ်းကြောင်းကြောင်း ဆုတ်ယုတ်မှုပုံစံကို မက်ထရစ်ပုံစံဖြင့် ပုံဖော်နိုင်သည်-

$\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}$

အထက်ဖော်ပြပါ မက်ထရစ်အသုံးအနှုန်းကို မက်ထရစ်တစ်ခုစီသို့ စာလုံးတစ်လုံးစီ သတ်မှတ်ခြင်းဖြင့် ပြန်လည်ရေးသားနိုင်သည်-

$Y=X\beta+\varepsilon$

ထို့ကြောင့်၊ အနည်းဆုံး စတုရန်းစံသတ်မှတ်ချက်ကို ကျင့်သုံးခြင်းဖြင့်၊ များစွာသော မျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ၏ ကိန်းဂဏန်းများကို ခန့်မှန်းရန် ဖော်မြူလာ သို့ ကျွန်ုပ်တို့ ရောက်ရှိနိုင်သည်-

$\widehat{\beta}=\left(X^tX\right)^{-1}X^tY$

သို့သော်၊ ဤဖော်မြူလာ၏အသုံးချမှုသည် အလွန်ပင်ပန်းပြီး အချိန်ကုန်သောကြောင့် လက်တွေ့တွင် Multiple regression model ကိုပိုမိုလျင်မြန်စွာဖန်တီးနိုင်သည့် ကွန်ပျူတာဆော့ဖ်ဝဲ (ဥပမာ Minitab သို့မဟုတ် Excel) ကို အသုံးပြုရန် အကြံပြုထားသည်။

➤ ကြည့်ပါ- များစွာသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို ဘာသာပြန်ခြင်း။

Linear Regression ယူဆချက်

linear regression model တွင်၊ model မှန်ကန်စေရန်အတွက် အောက်ပါအခြေအနေများနှင့် ကိုက်ညီရမည်-

လွတ်လပ်ရေး – အကြွင်းအကျန်များသည် တစ်ခုနှင့်တစ်ခု အမှီအခိုကင်းရမည်။ စံပြလွတ်လပ်မှုကို သေချာစေရန် ဘုံနည်းလမ်းမှာ နမူနာကောက်ယူခြင်းလုပ်ငန်းစဉ်တွင် ကျပန်းထည့်သွင်းခြင်းဖြစ်ပါသည်။
Homoscedasticity : အကြွင်းအကျန်များ၏ ကွဲလွဲမှုများတွင် တူညီမှုရှိရမည်၊ ဆိုလိုသည်မှာ အကြွင်းအကျန်များ၏ ကွဲလွဲမှုမှာ စဉ်ဆက်မပြတ်ရှိနေရမည်ဖြစ်သည်။
Multicollinearity မဟုတ်သော- မော်ဒယ်တွင်ပါရှိသော ရှင်းလင်းချက် ကိန်းရှင်များသည် တစ်ခုနှင့်တစ်ခု ချိတ်ဆက်၍မရပါ သို့မဟုတ် အနည်းဆုံး ၎င်းတို့၏ဆက်ဆံရေးသည် အလွန်အားနည်းနေရပါမည်။
Normality : ကျန်ရှိသောပစ္စည်းများကို ပုံမှန်ဖြန့်ဝေရပါမည် သို့မဟုတ် တစ်နည်းအားဖြင့်ဆိုလိုရင်း 0 ဖြင့် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လုပ်ဆောင်ရမည်ဖြစ်သည်။
Linearity : တုံ့ပြန်မှု variable နှင့် explanatory variables အကြား ဆက်နွယ်မှုသည် linear ဖြစ်သည်ဟု ယူဆပါသည်။

linear regression ကို ဘာအတွက်အသုံးပြုသလဲ။

Linear regression တွင် အခြေခံအားဖြင့် အသုံးပြုမှု နှစ်ခုရှိသည်- Linear regression ကို explanatory variables နှင့် response variable အကြား ဆက်နွယ်မှုကို ရှင်းပြရန် အသုံးပြုပြီး အလားတူ၊ linear regression ကို လေ့လာမှုအသစ်အတွက် dependent variable ၏တန်ဖိုးကို ခန့်မှန်းရန် အသုံးပြုပါသည်။

linear regression model ၏ ညီမျှခြင်းကို ရယူခြင်းဖြင့်၊ model ရှိ variables များကြားတွင် ဆက်စပ်မှု အမျိုးအစားကို သိရှိနိုင်ပါသည်။ အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခု၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အပေါင်းလက္ခဏာဖြစ်ပါက၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါတွင် တိုးလာမည်ဖြစ်သည်။ အမှီအခိုကင်းသောကိန်းရှင်တစ်ခု၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အနုတ်ဖြစ်နေပါက၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါ လျော့နည်းသွားမည်ဖြစ်သည်။

တစ်ဖက်တွင်၊ linear regression တွင် တွက်ချက်ထားသော equation သည် value ခန့်မှန်းချက်များကို ပြုလုပ်နိုင်သည်။ ထို့ကြောင့်၊ စံပြညီမျှခြင်းသို့ explanatory variable များ၏ တန်ဖိုးများကို မိတ်ဆက်ပေးခြင်းဖြင့် data အသစ်တစ်ခုအတွက် dependent variable ၏တန်ဖိုးကို တွက်ချက်နိုင်ပါသည်။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။