Regression coefficient အတွက် ယုံကြည်မှုကြားကာလကို r တွက်နည်း
linear regression model တွင်၊ regression coefficient သည် ခန့်မှန်းသူ variable တွင် တစ်ယူနစ်တိုးလာခြင်းနှင့်ဆက်စပ်နေသော တုံ့ပြန်မှုကိန်းရှင် ၏ ပျမ်းမျှပြောင်းလဲမှုကို ပြောပြသည်။
ဆုတ်ယုတ်မှုကိန်းဂဏန်းအတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။
β 1 အတွက် ယုံကြည်မှုကြားကာလ : b 1 ± t 1-α/2၊ n-2 * se(b 1 )
ရွှေ-
- b 1 = Regression coefficient ကို ဆုတ်ယုတ်မှုဇယားတွင် ပြထားသည်။
- t 1-∝/2၊ n-2 = 1-∝ ယုံကြည်မှုအဆင့်အတွက် အရေးပါသော t တန်ဖိုးသည် လွတ်လပ်မှု၏ n-2 ဒီဂရီဖြစ်ပြီး n သည် ကျွန်ုပ်တို့၏ဒေတာအတွဲရှိ စုစုပေါင်းကြည့်ရှုမှုအရေအတွက်ဖြစ်သည်။
- se(b 1 ) = ဆုတ်ယုတ်မှုဇယားတွင် ပြသထားသည့် b 1 ၏ စံအမှား
အောက်ဖော်ပြပါ ဥပမာသည် လက်တွေ့တွင် ဆုတ်ယုတ်လျှောစောက်အတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်နည်းကို ပြသထားသည်။
ဥပမာ- R တွင် ဆုတ်ယုတ်မှုကိန်းဂဏန်းအတွက် ယုံကြည်မှုကြားကာလ
အတန်းတစ်ခုရှိ ကျောင်းသား 15 ဦးအတွက် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် ခန့်မှန်းတွက်ချက်မှုကိန်းရှင်နှင့် စာမေးပွဲရမှတ်များအဖြစ် လေ့လာထားသော နာရီများကို အသုံးပြု၍ ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့ အံဝင်ခွင်ကျဖြစ်စေလိုသည်ဆိုပါစို့။

R တွင် ဤရိုးရှင်းသော linear regression model နှင့်ကိုက်ညီရန် lm() function ကိုသုံးနိုင်သည်။
#create data frame df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14), score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89)) #fit linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -5,140 -3,219 -1,193 2,816 5,772 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 65,334 2,106 31,023 1.41e-13 *** hours 1.982 0.248 7.995 2.25e-06 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.641 on 13 degrees of freedom Multiple R-squared: 0.831, Adjusted R-squared: 0.818 F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06
ရလဒ်အတွက် ဖော်ကိန်း ခန့်မှန်းချက်များကို အသုံးပြု၍ တပ်ဆင်ထားသော ရိုးရှင်းသော မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို အောက်ပါအတိုင်း ရေးသားနိုင်ပါသည်။
ရမှတ် = 65.334 + 1.982*(နာရီလေ့လာသည်)
နာရီများအတွက် regression coefficient သည် 1.982 ဖြစ်ကြောင်း သတိပြုပါ။
၎င်းသည် သင်ယူချိန် နောက်ထပ်တစ်နာရီတိုင်းသည် စာမေးပွဲရမှတ်တွင် ပျမ်းမျှ 1,982 တိုးလာခြင်းနှင့် ဆက်စပ်နေကြောင်း ၎င်းကဆိုသည်။
regression coefficient အတွက် 95% ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် confinint() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။
#calculate confidence interval for regression coefficient for 'hours' confint(fit, ' hours ', level= 0.95 ) 2.5% 97.5% hours 1.446682 2.518068
regression coefficient အတွက် 95% ယုံကြည်မှုကြားကာလသည် [1.446၊ 2.518] ဖြစ်သည်။
ဤယုံကြည်မှုကြားကာလသည် 0 တန်ဖိုးမပါဝင်သောကြောင့်၊ လေ့လာသည့်နာရီနှင့် စာမေးပွဲအဆင့်ကြားတွင် စာရင်းအင်းအရ သိသာထင်ရှားသောဆက်စပ်မှုရှိကြောင်း ကျွန်ုပ်တို့ ကောက်ချက်ချနိုင်ပါသည်။
ဆုတ်ယုတ်မှုကိန်းဂဏန်းအတွက် 95% ယုံကြည်မှုကြားကာလကို ကိုယ်တိုင်တွက်ချက်ခြင်းဖြင့် ၎င်းသည် မှန်ကန်ကြောင်း ကျွန်ုပ်တို့လည်း အတည်ပြုနိုင်သည်-
- β 1 အတွက် 95% CI : b 1 ± t 1-α/2၊ n-2 * se(b 1 )
- β 1 အတွက် 95% CI : 1.982 ± t 0.975၊ 15-2 * 0.248
- β 1 အတွက် 95% CI : 1.982 ± 2.1604 * 0.248
- β 1 အတွက် 95% CI : [1.446၊ 2.518]
regression coefficient အတွက် 95% ယုံကြည်မှုကြားကာလသည် [1.446၊ 2.518] ဖြစ်သည်။
မှတ်ချက် #1- ကျွန်ုပ်တို့သည် လွတ်လပ်မှု 13 ဒီဂရီရှိသော 95% ယုံကြည်မှုအဆင့်နှင့် ကိုက်ညီသော အရေးပါသော t တန်ဖိုးကို ရှာရန် ကျွန်ုပ်တို့သည် ပြောင်းပြန် t ဖြန့်ချီရေးဂဏန်းတွက်စက်ကို အသုံးပြုခဲ့သည်။
မှတ်ချက် #2- မတူညီသောယုံကြည်မှုအဆင့်ဖြင့် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန်၊ confint() လုပ်ဆောင်ချက်ရှိ အဆင့် အငြင်းအခုံ၏တန်ဖိုးကို ပြောင်းလဲပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် linear regression အကြောင်း ထပ်လောင်းအချက်အလက်များကို ပေးဆောင်သည်-
R တွင် regression output ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် logistic regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း