Python ရှိ residual sum of squares တွက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ကျန်ရှိသော ဆိုသည်မှာ မှတ်သားထားသောတန်ဖိုးနှင့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

လက်ကျန် = သတိပြုမိသော တန်ဖိုး – ခန့်မှန်းထားသော တန်ဖိုး

ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအတွဲတစ်ခုနှင့် အံကိုက်မည်မျှ ကောင်းစွာနားလည်ရန် နည်းလမ်းတစ်ခုမှာ အောက်ပါအတိုင်း တွက်ချက်ထားသည့် ကျန်ရှိသော စတုရန်းများကို တွက်ချက်ရန်ဖြစ်သည်။

ကျန်နှစ်ထပ်ပေါင်း = Σ(e _i ) ²

ရွှေ-

Σ : “ ပေါင်း” ဟု အဓိပ္ပါယ်ရသော ဂရိသင်္ကေတ
e _i : i ^th အကြွင်း

တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်သည် ဒေတာအစုံနှင့် ကိုက်ညီလေလေဖြစ်သည်။

ဤသင်ခန်းစာသည် Python ရှိ ဆုတ်ယုတ်မှုပုံစံအတွက် ကျန်ရှိသောစတုရန်းများကို တွက်ချက်နည်း အဆင့်ဆင့် ဥပမာကို ပေးပါသည်။

အဆင့် 1: ဒေတာကိုထည့်ပါ။

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် စာကျက်ချိန်ကြာချိန်၊ ကြိုတင်ပြင်ဆင်သည့်စာမေးပွဲ စုစုပေါင်းအရေအတွက်နှင့် မတူညီသောကျောင်းသား ၁၄ ဦးမှရရှိသော စာမေးပွဲရလဒ်များနှင့် သက်ဆိုင်သော အချက်အလက်များကို ထည့်သွင်းပါမည်။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' hours ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5],
                   ' exams ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4],
                   ' score ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90]})

အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် “ နာရီ” နှင့် “ စာမေးပွဲများ” ကို ခန့်မှန်းပေးသူကိန်းရှင်များနှင့် “ ရမှတ်” အဖြစ် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် “ နာရီ” နှင့် “ စာမေးပွဲများ” ကိုအသုံးပြု၍ သာမန်အနည်းဆုံးစတုရန်းဆုတ်ယုတ်မှုလုပ်ဆောင်ရန် statsmodels စာကြည့်တိုက်မှ OLS() လုပ်ဆောင်ချက်ကို အသုံးပြု ပါမည် ။

 import statsmodels. api as sm

#define response variable
y = df[' score ']

#define predictor variables
x = df[[' hours ', ' exams ']]

#add constant to predictor variables
x = sm. add_constant (x)

#fit linear regression model
model = sm. OLS (y,x). fit ()

#view model summary
print ( model.summary ())

                            OLS Regression Results                            
==================================================== ============================
Dept. Variable: R-squared score: 0.722
Model: OLS Adj. R-squared: 0.671
Method: Least Squares F-statistic: 14.27
Date: Sat, 02 Jan 2021 Prob (F-statistic): 0.000878
Time: 15:58:35 Log-Likelihood: -41.159
No. Comments: 14 AIC: 88.32
Df Residuals: 11 BIC: 90.24
Model: 2                                         
Covariance Type: non-robust                                         
==================================================== ============================
                 coef std err t P>|t| [0.025 0.975]
-------------------------------------------------- ----------------------------
const 71.8144 3.680 19.517 0.000 63.716 79.913
hours 5.0318 0.942 5.339 0.000 2.958 7.106
exams -1.3186 1.063 -1.240 0.241 -3.658 1.021
==================================================== ============================
Omnibus: 0.976 Durbin-Watson: 1.270
Prob(Omnibus): 0.614 Jarque-Bera (JB): 0.757
Skew: -0.245 Prob(JB): 0.685
Kurtosis: 1.971 Cond. No. 12.1
==================================================== ============================

အဆင့် 3- ကျန်ရှိသော စတုရန်းနှစ်ခုကို တွက်ချက်ပါ။

မော်ဒယ်၏ ကျန်ရှိသော နှစ်ထပ်ကိန်းများကို တွက်ချက်ရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်ပါသည်။

 print ( model.ssr )

293.25612951525414

ကျန်ရှိသော စတုရန်း၏ပေါင်းလဒ်သည် 293,256 ဖြစ်သွားသည်။

ထပ်လောင်းအရင်းအမြစ်များ

Python တွင် ရိုးရှင်းသော linear regression လုပ်ဆောင်နည်း
Python တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
လေးထောင့်ကိန်းဂဏန်းအကြွင်းအကျန်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။