ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာခြင်း။

ဤဆောင်းပါးသည် ဆုတ်ယုတ်ခြင်းခွဲခြမ်းစိတ်ဖြာခြင်းဟူသည် အဘယ်အရာနှင့် ၎င်းကို စာရင်းအင်းများတွင် အသုံးပြုကြောင်း ရှင်းပြထားသည်။ ထို့အပြင်၊ ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှု အမျိုးအစားများ ကွဲပြားသည်ကို သင်တွေ့မြင်နိုင်မည်ဖြစ်သည်။

Regression analysis ဆိုတာ ဘာလဲ ။

စာရင်းဇယားများတွင်၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုသည် ကိန်းရှင်နှစ်ခု သို့မဟုတ် နှစ်ခုထက်ပိုသော ဆက်စပ်မှုကို လေ့လာသည့် လုပ်ငန်းစဉ်တစ်ခုဖြစ်သည်။ ပို၍တိကျသည်မှာ၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုတွင် လေ့လာမှုရှိ ကိန်းရှင်များကို သင်္ချာနည်းဖြင့် ဆက်စပ်ပေးသည့် ညီမျှခြင်းတစ်ခုကို တွက်ချက်ခြင်း ပါဝင်သည်။

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင် တည်ဆောက်ထားသော မော်ဒယ်ကို regression model ဟုခေါ်ပြီး လေ့လာထားသော variable များနှင့် ဆက်စပ်သော ညီမျှခြင်းကို regression equation ဟုခေါ်သည်။

ဥပမာအားဖြင့်၊ နိုင်ငံတစ်ခု၏ ငွေကြေးဖောင်းပွမှုနှင့် ၎င်း၏ GDP အကြား ဆက်စပ်မှုကို လေ့လာလိုပါက၊ ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်မှုကို ခွဲခြမ်းစိတ်ဖြာရန် ဆုတ်ယုတ်ခြင်းဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာမှုကို သင်လုပ်ဆောင်နိုင်သည်။ ဤအခြေအနေတွင်၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုမှရရှိသော ညီမျှခြင်းသည် ဆုတ်ယုတ်မှုမျဉ်းဖြစ်လိမ့်မည်။

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာခြင်း။

ထို့ကြောင့်၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုတစ်ခုတွင် ဒေတာနမူနာကို စုဆောင်းခြင်းပါဝင်ပြီး စုဆောင်းထားသော ဒေတာများမှ လေ့လာထားသော ကိန်းရှင်များကို သင်္ချာနည်းအရ ဆက်စပ်နိုင်စေမည့် ညီမျှခြင်းတစ်ခုကို တွက်ချက်သည်။

regression ခွဲခြမ်းစိတ်ဖြာမှုတွင်၊ regression model တွင်ထည့်သွင်းနိုင်သော variable နှစ်မျိုးအကြား ခွဲခြားရန် အရေးကြီးသည်-

  • Dependent variable (သို့မဟုတ် response variable) : ဤအရာသည် ကျွန်ုပ်တို့ခွဲခြမ်းစိတ်ဖြာလိုသောအချက်ဖြစ်သည်၊ ထို့ကြောင့် အခြားသော variable များ၏တန်ဖိုးအပေါ် မူတည်၍ ဤကိန်းရှင်၏တန်ဖိုးမည်သို့ကွဲပြားသည်ကိုကြည့်ရန် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို တည်ဆောက်ပါမည်။
  • အမှီအခိုကင်းသော ကိန်းရှင် (သို့မဟုတ် ရှင်းပြနိုင်သော ကိန်းရှင်) : ကျွန်ုပ်တို့ ခွဲခြမ်းစိတ်ဖြာလိုသော ကိန်းရှင်ကို လွှမ်းမိုးနိုင်ဖွယ်ရှိသော အချက်တစ်ခုဖြစ်သည်။ ဆိုလိုသည်မှာ လွတ်လပ်သောကိန်းရှင်၏တန်ဖိုးသည် မှီခိုကိန်းရှင်၏တန်ဖိုးကို သက်ရောက်သည်။

Regression ခွဲခြမ်းစိတ်ဖြာမှုအမျိုးအစားများ

အခြေခံအားဖြင့်၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှု အမျိုးအစား သုံးမျိုးရှိသည်။

  • ရိုးရှင်းသော Linear Regression ခွဲခြမ်းစိတ်ဖြာခြင်း – ဆုတ်ယုတ်မှုပုံစံတွင် အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခုရှိပြီး မှီခိုသောကိန်းရှင်တစ်ခုရှိပြီး ၎င်းတို့သည် မျဉ်းကြောင်းအတိုင်း ဆက်နွယ်နေပါသည်။
  • Multiple linear regression ပိုင်းခြားစိတ်ဖြာခြင်း – နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော အမှီအခိုကင်းသော variable များသည် မှီခိုကိန်းရှင်တစ်ခုနှင့် linearly ဆက်စပ်နေပါသည်။
  • Nonlinear regression ခွဲခြမ်းစိတ်ဖြာခြင်း – အမှီအခိုကင်းသော variable နှင့် dependent variable အကြား ဆက်နွယ်မှုကို nonlinear function ကို အသုံးပြု၍ စံနမူနာပြုပါသည်။

ရိုးရှင်းသော linear regression ခွဲခြမ်းစိတ်ဖြာခြင်း။

ရိုးရှင်းသော linear regression ကို linear equation ကို အသုံးပြု၍ သီးခြား variable နှစ်ခုလုံးနှင့် ဆက်စပ်ရန် အသုံးပြုသည်။

ရိုးရှင်းသော linear regression model ၏ညီမျှခြင်းသည် မျဉ်းဖြောင့်ဖြစ်သည်၊ ထို့ကြောင့် ၎င်းကို coefficients နှစ်ခုဖြင့် ဖွဲ့စည်းထားသည်- ညီမျှခြင်း (β 0 ) နှင့် variable နှစ်ခုကြားရှိ ဆက်စပ်ကိန်း (β 1 )။ ထို့ကြောင့်၊ ရိုးရှင်းသော linear regression model အတွက် ညီမျှခြင်းမှာ y=β 01 x ဖြစ်သည်။

y=\beta_0+\beta_1x

ရိုးရှင်းသော linear regression ၏ coefficients များကို တွက်ချက်ရန် ဖော်မြူလာများမှာ အောက်ပါအတိုင်းဖြစ်သည် ။

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

ရွှေ-

  • \beta_0

    regression line ၏ ကိန်းသေဖြစ်ပါသည်။

  • \beta_1

    regression line ၏ slope ဖြစ်သည်။

  • x_i

    ဒေတာ i ၏ လွတ်လပ်သော ကိန်းရှင် X ၏ တန်ဖိုးဖြစ်သည်။

  • y_i

    ဒေတာ i ၏ မှီခို variable Y ၏ တန်ဖိုးဖြစ်သည်။

  • \overline{x}

    လွတ်လပ်သော variable ၏ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။

  • \overline{y}

    dependent variable Y ၏ ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။

Multiple linear regression ခွဲခြမ်းစိတ်ဖြာခြင်း။

Multiple linear regression model တစ်ခုတွင်၊ အနည်းဆုံး သီးခြားသော ကိန်းရှင်နှစ်ခု ပါဝင်ပါသည်။ တစ်နည်းဆိုရသော် Multiple linear regression သည် များစွာသော explanatory variable များကို တုံ့ပြန်မှု variable နှင့် linearly ချိတ်ဆက်နိုင်စေပါသည်။ ထို့ကြောင့်၊ multiple linear regression model အတွက် ညီမျှခြင်းမှာ-

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

ရွှေ-

  • y

    dependent variable ဖြစ်ပါတယ်။

  • x_i

    လွတ်လပ်သော ကိန်းရှင် i ဖြစ်သည် ။

  • \beta_0

    Multiple linear regression equation ၏ ကိန်းသေဖြစ်ပါသည်။

  • \beta_i

    ကိန်းရှင်နှင့်ဆက်စပ်နေသော ဆုတ်ယုတ်မှုကိန်းဂဏန်းဖြစ်သည်။

    x_i

    .

  • \bm{\varepsilon}

    error သို့မဟုတ် residual ဖြစ်သည်၊ ဆိုလိုသည်မှာ သတိပြုမိသောတန်ဖိုးနှင့် မော်ဒယ်မှ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ကို ဆိုလိုသည်။

  • m

    မော်ဒယ်ရှိ ကိန်းရှင်များ စုစုပေါင်း အရေအတွက် ဖြစ်ပါသည်။

ဒီတော့ စုစုပေါင်းနမူနာတစ်ခုရရင်

n

လေ့လာချက်များအရ၊ ကျွန်ုပ်တို့သည် မျဉ်းကြောင်းကြောင်း ဆုတ်ယုတ်မှုပုံစံကို မက်ထရစ်ပုံစံဖြင့် ပုံဖော်နိုင်သည်-

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

အထက်ဖော်ပြပါ မက်ထရစ်အသုံးအနှုန်းကို မက်ထရစ်တစ်ခုစီသို့ စာလုံးတစ်လုံးစီ သတ်မှတ်ခြင်းဖြင့် ပြန်လည်ရေးသားနိုင်သည်-

Y=X\beta+\varepsilon

ထို့ကြောင့်၊ အနည်းဆုံး စတုရန်းစံသတ်မှတ်ချက်ကို ကျင့်သုံးခြင်းဖြင့်၊ များစွာသော မျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ၏ ကိန်းဂဏန်းများကို ခန့်မှန်းရန် ဖော်မြူလာ သို့ ကျွန်ုပ်တို့ ရောက်ရှိနိုင်သည်-

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

သို့သော်၊ ဤဖော်မြူလာ၏အသုံးချမှုသည် အလွန်ပင်ပန်းပြီး အချိန်ကုန်သောကြောင့်၊ ထို့ကြောင့် လက်တွေ့တွင် Multiple regression model ကိုပိုမိုမြန်ဆန်စွာဖန်တီးနိုင်သည့် ကွန်ပျူတာဆော့ဖ်ဝဲ (ဥပမာ Minitab သို့မဟုတ် Excel ကဲ့သို့) ကိုအသုံးပြုရန် အကြံပြုထားသည်။

Nonlinear ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာခြင်း။

စာရင်းဇယားများတွင်၊ linear regression သည် regression equation ၏ စံပြအဖြစ် nonlinear function ကိုအသုံးပြုသည့် regression အမျိုးအစားတစ်ခုဖြစ်သည်။ ထို့ကြောင့်၊ nonlinear regression model ၏ equation သည် nonlinear function တစ်ခုဖြစ်သည်။

ယုတ္တိနည်းအားဖြင့်၊ ကိန်းရှင်နှစ်ခုကြားက မျဉ်းမညီသော ဆက်နွယ်မှု မရှိသောအခါတွင် အမှီအခိုကင်းသော ကိန်းရှင်နှင့် ဆက်စပ်ကိန်းရှင်အား ဆက်စပ်ရန် ယုတ္တိနည်းအားဖြင့် အသုံးပြုသည်။ ထို့ကြောင့်၊ နမူနာဒေတာကို ဂရပ်ဖစ်ရေးဆွဲသည့်အခါ ၎င်းတို့တွင် linear ဆက်နွယ်မှုမရှိကြောင်း၊ ဆိုလိုသည်မှာ၊ ၎င်းတို့သည် ခန့်မှန်းခြေအားဖြင့် မျဉ်းဖြောင့်ပုံစံမဟုတ်ပါက၊ non-linear regression model ကိုအသုံးပြုခြင်းသည် ပိုကောင်းပါသည်။

ဥပမာအားဖြင့်၊ ညီမျှခြင်း y=3-5x-8x 2 +x 3 သည် အမှီအခိုကင်းသော variable X ကို ကုဗလုပ်ဆောင်ချက်မှတစ်ဆင့် သင်္ချာနည်းအရ ဆက်စပ်နေသောကြောင့် မျဉ်းမဟုတ်သော ဆုတ်ယုတ်မှုပုံစံဖြစ်သည်။

အဓိကအားဖြင့် nonlinear regression အမျိုးအစား သုံးမျိုးရှိသည်။

  • Polynomial Regression – ညီမျှခြင်းသည် ပေါင်းကိန်းတစ်ခု၏ပုံစံတွင်ရှိသော လိုင်းမဟုတ်သောဆုတ်ယုတ်မှု။
  • y=\beta_0+\beta_1 x+\beta_2 x^2+\beta_3 x^3+\dots+\beta_m x^m

  • လော့ဂရစ်သမ် ဆုတ်ယုတ်မှု – အမှီအခိုကင်းသော ကိန်းရှင်အား လော့ဂရစ်သမ်ဖြင့် ပြုလုပ်သည့် လိုင်းမဟုတ်သော ဆုတ်ယုတ်မှု။
  • y=\beta_0+\beta_1\cdot \ln(x)

  • Exponential Regression – ညီမျှခြင်း၏ ထပ်ကိန်းတွင် သီးခြားကိန်းရှင်သည် လိုင်းမဟုတ်သော ဆုတ်ယုတ်မှု။
  • y=\beta_0\cdot e^{\beta_1\cdot x}

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာခြင်း (regression analysis) ကို ဘာအတွက် အသုံးပြုသလဲ ။

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင် အခြေခံအားဖြင့် အသုံးပြုမှု နှစ်ခုရှိသည်- Regression ခွဲခြမ်းစိတ်ဖြာမှုကို ရှင်းလင်းချက်ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ရှင်းပြရန် အသုံးပြုပြီး အလားတူပင်၊ လေ့လာမှုအသစ်တစ်ခုအတွက် မှီခိုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းရန် ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုကို အသုံးပြုသည်။

regression model ၏ ညီမျှခြင်းကို ရယူခြင်းဖြင့်၊ model ရှိ variables များကြားတွင် ဆက်စပ်မှု အမျိုးအစားကို သိရှိနိုင်ပါသည်။ အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခု၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အပေါင်းလက္ခဏာဖြစ်ပါက၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါတွင် တိုးလာမည်ဖြစ်သည်။ အမှီအခိုကင်းသော variable ၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အနုတ်ဖြစ်သော်လည်း၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါတွင် လျော့နည်းသွားမည်ဖြစ်သည်။

အခြားတစ်ဖက်တွင်၊ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုမှရရှိသော သင်္ချာညီမျှခြင်းသည်လည်း ကျွန်ုပ်တို့အား တန်ဖိုးခန့်မှန်းချက်များကို ပြုလုပ်နိုင်စေပါသည်။ ထို့ကြောင့်၊ regression model ၏ ညီမျှခြင်းသို့ explanatory variable များ၏ တန်ဖိုးများကို မိတ်ဆက်ပေးခြင်းဖြင့် data အသစ်တစ်ခုအတွက် dependent variable ၏တန်ဖိုးကို တွက်ချက်နိုင်ပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်