Python ရှိ residual sum of squares တွက်နည်း


ကျန်ရှိသော ဆိုသည်မှာ မှတ်သားထားသောတန်ဖိုးနှင့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

လက်ကျန် = သတိပြုမိသော တန်ဖိုး – ခန့်မှန်းထားသော တန်ဖိုး

ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအတွဲတစ်ခုနှင့် အံကိုက်မည်မျှ ကောင်းစွာနားလည်ရန် နည်းလမ်းတစ်ခုမှာ အောက်ပါအတိုင်း တွက်ချက်ထားသည့် ကျန်ရှိသော စတုရန်းများကို တွက်ချက်ရန်ဖြစ်သည်။

ကျန်နှစ်ထပ်ပေါင်း = Σ(e i ) 2

ရွှေ-

  • Σ : “ ပေါင်း” ဟု အဓိပ္ပါယ်ရသော ဂရိသင်္ကေတ
  • e i : i th အကြွင်း

တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်သည် ဒေတာအစုံနှင့် ကိုက်ညီလေလေဖြစ်သည်။

ဤသင်ခန်းစာသည် Python ရှိ ဆုတ်ယုတ်မှုပုံစံအတွက် ကျန်ရှိသောစတုရန်းများကို တွက်ချက်နည်း အဆင့်ဆင့် ဥပမာကို ပေးပါသည်။

အဆင့် 1: ဒေတာကိုထည့်ပါ။

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် စာကျက်ချိန်ကြာချိန်၊ ကြိုတင်ပြင်ဆင်သည့်စာမေးပွဲ စုစုပေါင်းအရေအတွက်နှင့် မတူညီသောကျောင်းသား ၁၄ ဦးမှရရှိသော စာမေးပွဲရလဒ်များနှင့် သက်ဆိုင်သော အချက်အလက်များကို ထည့်သွင်းပါမည်။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' hours ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5],
                   ' exams ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4],
                   ' score ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90]})

အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် “ နာရီ” နှင့် “ စာမေးပွဲများ” ကို ခန့်မှန်းပေးသူကိန်းရှင်များနှင့် “ ရမှတ်” အဖြစ် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် “ နာရီ” နှင့် “ စာမေးပွဲများ” ကိုအသုံးပြု၍ သာမန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှုလုပ်ဆောင်ရန် statsmodels စာကြည့်တိုက်မှ OLS() လုပ်ဆောင်ချက်ကို အသုံးပြု ပါမည်

 import statsmodels. api as sm

#define response variable
y = df[' score ']

#define predictor variables
x = df[[' hours ', ' exams ']]

#add constant to predictor variables
x = sm. add_constant (x)

#fit linear regression model
model = sm. OLS (y,x). fit ()

#view model summary
print ( model.summary ())

                            OLS Regression Results                            
==================================================== ============================
Dept. Variable: R-squared score: 0.722
Model: OLS Adj. R-squared: 0.671
Method: Least Squares F-statistic: 14.27
Date: Sat, 02 Jan 2021 Prob (F-statistic): 0.000878
Time: 15:58:35 Log-Likelihood: -41.159
No. Comments: 14 AIC: 88.32
Df Residuals: 11 BIC: 90.24
Model: 2                                         
Covariance Type: non-robust                                         
==================================================== ============================
                 coef std err t P>|t| [0.025 0.975]
-------------------------------------------------- ----------------------------
const 71.8144 3.680 19.517 0.000 63.716 79.913
hours 5.0318 0.942 5.339 0.000 2.958 7.106
exams -1.3186 1.063 -1.240 0.241 -3.658 1.021
==================================================== ============================
Omnibus: 0.976 Durbin-Watson: 1.270
Prob(Omnibus): 0.614 Jarque-Bera (JB): 0.757
Skew: -0.245 Prob(JB): 0.685
Kurtosis: 1.971 Cond. No. 12.1
==================================================== ============================

အဆင့် 3- ကျန်ရှိသော စတုရန်းနှစ်ခုကို တွက်ချက်ပါ။

မော်ဒယ်၏ ကျန်ရှိသော နှစ်ထပ်ကိန်းများကို တွက်ချက်ရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်ပါသည်။

 print ( model.ssr )

293.25612951525414

ကျန်ရှိသော စတုရန်း၏ပေါင်းလဒ်သည် 293,256 ဖြစ်သွားသည်။

ထပ်လောင်းအရင်းအမြစ်များ

Python တွင် ရိုးရှင်းသော linear regression လုပ်ဆောင်နည်း
Python တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
လေးထောင့်ကိန်းဂဏန်းအကြွင်းအကျန်များ

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်