Python တွင် r-squared တွက်ချက်နည်း (ဥပမာဖြင့်)


R-squared ၊ မကြာခဏရေးထားသော R2 သည် linear regression model တွင် ခန့်မှန်းသူကိန်းရှင်များမှ ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။

R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ 1 အထိ ကွဲပြားနိုင်သည်-

  • 0 သည် တုံ့ပြန်မှုကိန်းရှင်ကို ခန့်မှန်းသူကိန်းရှင်က လုံးဝရှင်းပြ၍မရကြောင်း ညွှန်ပြသည်။
  • 1 သည် တုံ့ပြန်မှုကိန်းရှင်အား ကြိုတင်ခန့်မှန်းကိန်းရှင်များမှ အမှားအယွင်းမရှိဘဲ စုံလင်စွာရှင်းပြနိုင်သည်ကို ညွှန်ပြသည်။

အောက်ပါဥပမာသည် Python ရှိ regression model အတွက် R 2 ကို တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ- Python တွင် R-squared တွက်ချက်ပါ။

ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' hours ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6],
                   ' prep_exams ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2],
                   ' score ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96]})

#view DataFrame
print (df)

    hours prep_exams score
0 1 1 76
1 2 3 78
2 2 3 85
3 4 5 88
4 2 2 72
5 1 2 69
6 5 1 94
7 4 1 94
8 2 0 88
9 4 3 92
10 4 4 90
11 3 3 75
12 6 2 96

ကျွန်ုပ်တို့သည် မော်ဒယ်၏ R-squared တန်ဖိုးကို တွက်ချက်ရန် sklearn ‘s LinearRegression() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပြီး ဆုတ်ယုတ်မှုပုံစံနှင့် ရမှတ်() လုပ်ဆောင်ချက်ကို ကိုက်ညီရန်-

 from sklearn.linear_model import LinearRegression

#initiate linear regression model
model = LinearRegression()

#define predictor and response variables
x, y = df[[" hours ", " prep_exams "]], df. score

#fit regression model
model. fit (x,y)

#calculate R-squared of regression model
r_squared = model. score (x,y)

#view R-squared value
print (r_squared)

0.7175541714105901

မော်ဒယ်၏ R စတုရန်းသည် 0.7176 ဖြစ်လာသည်။

ဆိုလိုသည်မှာ စာမေးပွဲရမှတ်များ ကွဲလွဲမှု၏ 71.76% ကို လေ့လာသည့် နာရီအရေအတွက်နှင့် ဖြေဆိုခဲ့သော လေ့ကျင့်မှု စာမေးပွဲအရေအတွက်ဖြင့် ရှင်းပြနိုင်သည်။

ကျွန်ုပ်တို့အလိုရှိပါက၊ ဤ R-squared တန်ဖိုးကို အခြားသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် မတူညီသော ဆုတ်ယုတ်မှုပုံစံနှင့် နှိုင်းယှဉ်နိုင်ပါသည်။

ယေဘူယျအားဖြင့်၊ မြင့်မားသော R-squared တန်ဖိုးများရှိသော မော်ဒယ်များသည် မော်ဒယ်ရှိ ခန့်မှန်းသူကိန်းရှင်များအစုတွင် တုံ့ပြန်မှုကိန်းရှင်၏ ကွဲလွဲမှုကို ကောင်းစွာရှင်းပြနိုင်သောကြောင့် ဦးစားပေးပါသည်။

ဆက်စပ်မှု- ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Python တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
Python တွင် မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား လုပ်ဆောင်နည်း
Python ရှိ regression မော်ဒယ်များ၏ AIC တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်