Python တွင် ချိန်ညှိထားသော r-squared တွက်ချက်နည်း


R-squared ၊ မကြာခဏရေးထားသော R2 သည် linear regression model တွင် ခန့်မှန်းသူကိန်းရှင်များမှ ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။

R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ 1 အထိရှိနိုင်ပါသည်။ 0 တန်ဖိုးတစ်ခုသည် ခန့်မှန်းသူကိန်းရှင်မှ ရှင်းပြခြင်းမပြုနိုင်သော်လည်း 1 တန်ဖိုးက တုံ့ပြန်မှုကိန်းရှင်ကို ခန့်မှန်းသူကိန်းရှင်က ရှင်းပြနိုင်သည်ဟု ညွှန်ပြနေပါသည်။ ခန့်မှန်းသူမှ အမှားအယွင်းမရှိ စုံလင်စွာ ရှင်းပြပါသည်။ ကိန်းရှင်များ။

Adjusted R-squared သည် regression model ရှိ ကြိုတင်ခန့်မှန်းသူအရေအတွက်အတွက် ချိန်ညှိပေးသော R-squared ၏ မွမ်းမံထားသောဗားရှင်းတစ်ခုဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။

ချိန်ညှိထားသော R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

ရွှေ-

  • R 2 : မော်ဒယ်၏ R 2
  • n : လေ့လာတွေ့ရှိချက်အရေအတွက်
  • k : ကြိုတင်ခန့်မှန်းကိန်းရှင် အရေအတွက်

R2 သည် မော်ဒယ်တစ်ခုသို့ ကြိုတင်ခန့်မှန်းချက်များကို ပေါင်းထည့်လိုက်သည်နှင့်အမျှ အမြဲတမ်းတိုးလာသောကြောင့်၊ ချိန်ညှိထားသော R2 သည် မော်ဒယ်တစ်ခုအတွက် မည်မျှအသုံးဝင်သည်ကို ပြောပြသည့် မက်ထရစ်တစ်ခုအဖြစ် လုပ်ဆောင်နိုင်ပြီး မော်ဒယ်တစ်ခုအတွင်းရှိ ခန့်မှန်းသူအရေအတွက်အပေါ် မူတည်၍ ချိန်ညှိနိုင်သည်

ဤသင်ခန်းစာတွင် Python ရှိ ဆုတ်ယုတ်မှုပုံစံအတွက် ချိန်ညှိထားသော R2 တွက်ချက်မှုနမူနာနှစ်ခုကို ပြသထားသည်။

ဆက်စပ်မှု- ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။

ဥပမာ 1- ချိန်ညှိထားသော R-squared ကို sklearn ဖြင့် တွက်ချက်ပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် များစွာသော မျဉ်းကြောင်း ဆုတ်ယုတ်မှု မော်ဒယ်ကို မည်သို့ အံဝင်ခွင်ကျ ဖြစ်စေရန် နှင့် sklearn ကို အသုံးပြု၍ မော်ဒယ်၏ တပ်ဆင်ထားသော R-squared ကို တွက်ချက်နိုင်သည် ။

 from sklearn. linear_model import LinearRegression
import pandas as pd

#define URL where dataset is located
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv"

#read in data
data = pd. read_csv (url)

#fit regression model
model = LinearRegression ()
x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp
model. fit (x,y)

#display adjusted R-squared
1 - (1-model. score (X, y))*( len (y)-1)/( len (y)-X. shape [1]-1)

0.7787005290062521

မော်ဒယ်၏ ချိန်ညှိထားသော R-squared သည် 0.7787 ဖြစ်သွားသည်။

ဥပမာ 2- ကိန်းဂဏန်းပုံစံများဖြင့် ချိန်ညှိထားသော R-squared ကို တွက်ချက်ပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် များစွာသော မျဉ်းကြောင်း ဆုတ်ယုတ်မှု မော်ဒယ်ကို မည်သို့ အံဝင်ခွင်ကျ လုပ်ရမည်ကို ပြသပြီး statsmodels ကို အသုံးပြု၍ မော်ဒယ်၏ တပ်ဆင်ထားသော R-squared ကို တွက်ချက်သည်-

 import statsmodels. api as sm
import pandas as pd

#define URL where dataset is located
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv"

#read in data
data = pd. read_csv (url)

#fit regression model
x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp
X = sm. add_constant (X)
model = sm. OLS (y,x). fit ()

#display adjusted R-squared
print ( model.rsquared_adj )

0.7787005290062521

မော်ဒယ်၏ ချိန်ညှိထားသော R-squared သည် 0.7787 ဖြစ်လာသည်၊ ၎င်းသည် ယခင်ဥပမာ၏ ရလဒ်နှင့် ကိုက်ညီသည်။

ထပ်လောင်းအရင်းအမြစ်များ

Python တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Python တွင် မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား လုပ်ဆောင်နည်း
Python ရှိ regression မော်ဒယ်များ၏ AIC တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်