Python တွင် ချိန်ညှိထားသော r-squared တွက်ချက်နည်း
R-squared ၊ မကြာခဏရေးထားသော R2 သည် linear regression model တွင် ခန့်မှန်းသူကိန်းရှင်များမှ ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။
R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ 1 အထိရှိနိုင်ပါသည်။ 0 တန်ဖိုးတစ်ခုသည် ခန့်မှန်းသူကိန်းရှင်မှ ရှင်းပြခြင်းမပြုနိုင်သော်လည်း 1 တန်ဖိုးက တုံ့ပြန်မှုကိန်းရှင်ကို ခန့်မှန်းသူကိန်းရှင်က ရှင်းပြနိုင်သည်ဟု ညွှန်ပြနေပါသည်။ ခန့်မှန်းသူမှ အမှားအယွင်းမရှိ စုံလင်စွာ ရှင်းပြပါသည်။ ကိန်းရှင်များ။
Adjusted R-squared သည် regression model ရှိ ကြိုတင်ခန့်မှန်းသူအရေအတွက်အတွက် ချိန်ညှိပေးသော R-squared ၏ မွမ်းမံထားသောဗားရှင်းတစ်ခုဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။
ချိန်ညှိထားသော R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
ရွှေ-
- R 2 : မော်ဒယ်၏ R 2
- n : လေ့လာတွေ့ရှိချက်အရေအတွက်
- k : ကြိုတင်ခန့်မှန်းကိန်းရှင် အရေအတွက်
R2 သည် မော်ဒယ်တစ်ခုသို့ ကြိုတင်ခန့်မှန်းချက်များကို ပေါင်းထည့်လိုက်သည်နှင့်အမျှ အမြဲတမ်းတိုးလာသောကြောင့်၊ ချိန်ညှိထားသော R2 သည် မော်ဒယ်တစ်ခုအတွက် မည်မျှအသုံးဝင်သည်ကို ပြောပြသည့် မက်ထရစ်တစ်ခုအဖြစ် လုပ်ဆောင်နိုင်ပြီး မော်ဒယ်တစ်ခုအတွင်းရှိ ခန့်မှန်းသူအရေအတွက်အပေါ် မူတည်၍ ချိန်ညှိနိုင်သည် ။
ဤသင်ခန်းစာတွင် Python ရှိ ဆုတ်ယုတ်မှုပုံစံအတွက် ချိန်ညှိထားသော R2 တွက်ချက်မှုနမူနာနှစ်ခုကို ပြသထားသည်။
ဆက်စပ်မှု- ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။
ဥပမာ 1- ချိန်ညှိထားသော R-squared ကို sklearn ဖြင့် တွက်ချက်ပါ။
အောက်ဖော်ပြပါ ကုဒ်သည် များစွာသော မျဉ်းကြောင်း ဆုတ်ယုတ်မှု မော်ဒယ်ကို မည်သို့ အံဝင်ခွင်ကျ ဖြစ်စေရန် နှင့် sklearn ကို အသုံးပြု၍ မော်ဒယ်၏ တပ်ဆင်ထားသော R-squared ကို တွက်ချက်နိုင်သည် ။
from sklearn. linear_model import LinearRegression import pandas as pd #define URL where dataset is located url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv" #read in data data = pd. read_csv (url) #fit regression model model = LinearRegression () x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp model. fit (x,y) #display adjusted R-squared 1 - (1-model. score (X, y))*( len (y)-1)/( len (y)-X. shape [1]-1) 0.7787005290062521
မော်ဒယ်၏ ချိန်ညှိထားသော R-squared သည် 0.7787 ဖြစ်သွားသည်။
ဥပမာ 2- ကိန်းဂဏန်းပုံစံများဖြင့် ချိန်ညှိထားသော R-squared ကို တွက်ချက်ပါ။
အောက်ဖော်ပြပါ ကုဒ်သည် များစွာသော မျဉ်းကြောင်း ဆုတ်ယုတ်မှု မော်ဒယ်ကို မည်သို့ အံဝင်ခွင်ကျ လုပ်ရမည်ကို ပြသပြီး statsmodels ကို အသုံးပြု၍ မော်ဒယ်၏ တပ်ဆင်ထားသော R-squared ကို တွက်ချက်သည်-
import statsmodels. api as sm import pandas as pd #define URL where dataset is located url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv" #read in data data = pd. read_csv (url) #fit regression model x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp X = sm. add_constant (X) model = sm. OLS (y,x). fit () #display adjusted R-squared print ( model.rsquared_adj ) 0.7787005290062521
မော်ဒယ်၏ ချိန်ညှိထားသော R-squared သည် 0.7787 ဖြစ်လာသည်၊ ၎င်းသည် ယခင်ဥပမာ၏ ရလဒ်နှင့် ကိုက်ညီသည်။
ထပ်လောင်းအရင်းအမြစ်များ
Python တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Python တွင် မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား လုပ်ဆောင်နည်း
Python ရှိ regression မော်ဒယ်များ၏ AIC တွက်ချက်နည်း