Python တွင် r-squared တွက်ချက်နည်း (ဥပမာဖြင့်)
R-squared ၊ မကြာခဏရေးထားသော R2 သည် linear regression model တွင် ခန့်မှန်းသူကိန်းရှင်များမှ ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။
R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ 1 အထိ ကွဲပြားနိုင်သည်-
- 0 သည် တုံ့ပြန်မှုကိန်းရှင်ကို ခန့်မှန်းသူကိန်းရှင်က လုံးဝရှင်းပြ၍မရကြောင်း ညွှန်ပြသည်။
- 1 သည် တုံ့ပြန်မှုကိန်းရှင်အား ကြိုတင်ခန့်မှန်းကိန်းရှင်များမှ အမှားအယွင်းမရှိဘဲ စုံလင်စွာရှင်းပြနိုင်သည်ကို ညွှန်ပြသည်။
အောက်ပါဥပမာသည် Python ရှိ regression model အတွက် R 2 ကို တွက်ချက်နည်းကို ပြသထားသည်။
ဥပမာ- Python တွင် R-squared တွက်ချက်ပါ။
ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။
import pandas as pd #createDataFrame df = pd. DataFrame ({' hours ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6], ' prep_exams ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2], ' score ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96]}) #view DataFrame print (df) hours prep_exams score 0 1 1 76 1 2 3 78 2 2 3 85 3 4 5 88 4 2 2 72 5 1 2 69 6 5 1 94 7 4 1 94 8 2 0 88 9 4 3 92 10 4 4 90 11 3 3 75 12 6 2 96
ကျွန်ုပ်တို့သည် မော်ဒယ်၏ R-squared တန်ဖိုးကို တွက်ချက်ရန် sklearn ‘s LinearRegression() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပြီး ဆုတ်ယုတ်မှုပုံစံနှင့် ရမှတ်() လုပ်ဆောင်ချက်ကို ကိုက်ညီရန်-
from sklearn.linear_model import LinearRegression
#initiate linear regression model
model = LinearRegression()
#define predictor and response variables
x, y = df[[" hours ", " prep_exams "]], df. score
#fit regression model
model. fit (x,y)
#calculate R-squared of regression model
r_squared = model. score (x,y)
#view R-squared value
print (r_squared)
0.7175541714105901
မော်ဒယ်၏ R စတုရန်းသည် 0.7176 ဖြစ်လာသည်။
ဆိုလိုသည်မှာ စာမေးပွဲရမှတ်များ ကွဲလွဲမှု၏ 71.76% ကို လေ့လာသည့် နာရီအရေအတွက်နှင့် ဖြေဆိုခဲ့သော လေ့ကျင့်မှု စာမေးပွဲအရေအတွက်ဖြင့် ရှင်းပြနိုင်သည်။
ကျွန်ုပ်တို့အလိုရှိပါက၊ ဤ R-squared တန်ဖိုးကို အခြားသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် မတူညီသော ဆုတ်ယုတ်မှုပုံစံနှင့် နှိုင်းယှဉ်နိုင်ပါသည်။
ယေဘူယျအားဖြင့်၊ မြင့်မားသော R-squared တန်ဖိုးများရှိသော မော်ဒယ်များသည် မော်ဒယ်ရှိ ခန့်မှန်းသူကိန်းရှင်များအစုတွင် တုံ့ပြန်မှုကိန်းရှင်၏ ကွဲလွဲမှုကို ကောင်းစွာရှင်းပြနိုင်သောကြောင့် ဦးစားပေးပါသည်။
ဆက်စပ်မှု- ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Python တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Python တွင် မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား လုပ်ဆောင်နည်း
Python ရှိ regression မော်ဒယ်များ၏ AIC တွက်ချက်နည်း