R ဖြင့် sst၊ ssr နှင့် sse တွက်နည်း


ဆုတ်ယုတ်မှုမျဉ်းသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီမှုရှိသည်ကို တိုင်းတာရန် မတူညီသော လေးထောင့် တန်ဖိုးများ သုံးခုကို ကျွန်ုပ်တို့ အသုံးပြုလေ့ရှိသည်-

1. စုစုပေါင်းစတုရန်းများ (SST) – တစ်ဦးချင်းဒေတာအချက်များ (y i ) နှင့် တုံ့ပြန်မှုကိန်းရှင်၏ပျမ်းမျှ ( y ) အကြား ကွာခြားချက်များ၏ လေးထပ်ကိန်းများ။

  • SST = Σ(y iy )

2. Sum of Squares Regression (SSR) – ခန့်မှန်းထားသော ဒေတာအချက်များ (ŷ i ) နှင့် တုံ့ပြန်မှု variable ၏ပျမ်းမျှ ( y ) အကြားကွာခြားချက်များ၏ နှစ်ထပ်ကိန်းများ။

  • SSR = Σ(ŷ iy )

3. Sum of Squares Error (SSE) – ခန့်မှန်းထားသော ဒေတာအချက်များ (ŷ i ) နှင့် စောင့်ကြည့်လေ့လာထားသော ဒေတာအချက်များ (y i ) အကြား ကွာခြားချက်များ၏ လေးထပ်ကိန်းများ။

  • SSE = Σ(ŷ i – y i )

အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် R တွင် ပေးထားသော ဆုတ်ယုတ်မှုပုံစံအတွက် ဤမက်ထရစ်တစ်ခုစီကို တွက်ချက်နည်းကို ပြသထားသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ပထမဦးစွာ၊ ပေးထားသည့်ကောလိပ်တစ်ခုမှ မတူညီသောကျောင်းသား 20 အတွက် ရရှိသော နာရီအရေအတွက်နှင့် စာမေးပွဲရမှတ်များပါဝင်သော ဒေတာအတွဲတစ်ခုကို ဖန်တီးကြပါစို့။

 #create data frame
df <- data. frame (hours=c(1, 1, 1, 2, 2, 2, 2, 2, 3, 3,
                         3, 4, 4, 4, 5, 5, 6, 7, 7, 8),
                 score=c(68, 76, 74, 80, 76, 78, 81, 84, 86, 83,
                         88, 85, 89, 94, 93, 94, 96, 89, 92, 97))

#view first six rows of data frame
head(df)

  hours score
1 1 68
2 1 76
3 1 74
4 2 80
5 2 76
6 2 78

အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင် နှင့် ခန့်မှန်းသူကိန်းရှင်အဖြစ် ရမှတ်ကို အသုံးပြု၍ ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံနှင့်ကိုက်ညီရန် lm() လုပ်ဆောင်ချက်ကို အသုံးပြုပါမည်။

 #fit regression model
model <- lm(score ~ hours, data = df)

#view model summary
summary(model)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-8.6970 -2.5156 -0.0737 3.1100 7.5495 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 73.4459 1.9147 38.360 < 2nd-16 ***
hours 3.2512 0.4603 7.063 1.38e-06 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.289 on 18 degrees of freedom
Multiple R-squared: 0.7348, Adjusted R-squared: 0.7201 
F-statistic: 49.88 on 1 and 18 DF, p-value: 1.378e-06

အဆင့် 3- SST၊ SSR နှင့် SSE ကို တွက်ချက်ပါ။

SST၊ SSR နှင့် SSE တို့ကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #find sse
sse <- sum (( fitted (model) - df$score)^2)
sse

[1] 331.0749

#find ssr
ssr <- sum (( fitted (model) - mean (df$score))^2)
ssr

[1] 917.4751

#find sst
sst <- ssr + sse
sst

[1] 1248.55

တိုင်းတာမှုများသည်-

  • စုစုပေါင်း နှစ်ထပ်ကိန်းများ (SST): 1248.55
  • Sum of Squares Regression (SSR): 917.4751
  • စတုရန်းအမှားအယွင်း (SSE): 331.0749

SST = SSR + SSE ကို စစ်ဆေးနိုင်သည်-

  • SST = SSR + SSE
  • 1248.55 = 917.4751 + 331.0749

ဆုတ်ယုတ်မှုပုံစံ၏ R နှစ်ထပ်ကိန်း ကိုလည်း ကိုယ်တိုင်တွက်ချက်နိုင်သည်။

  • R နှစ်ထပ်ကိန်း = SSR/SST
  • R နှစ်ထပ် = 917.4751 / 1248.55
  • R နှစ်ထပ်ကိန်း = 0.7348

၎င်းသည် ကျွန်ုပ်တို့အား စာမေးပွဲရမှတ်များတွင် ကွဲလွဲမှု 73.48% ကို လေ့လာသည့် နာရီအရေအတွက်ဖြင့် ရှင်းပြနိုင်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

ရိုးရှင်းသော linear regression line အတွက် SST၊ SSR နှင့် SSE ကို အလိုအလျောက်တွက်ချက်ရန် အောက်ပါဂဏန်းတွက်စက်များကို သင်အသုံးပြုနိုင်ပါသည်။

SST ဂဏန်းတွက်စက်
RSS ဂဏန်းတွက်စက်
ESS ဂဏန်းပေါင်းစက်

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်