R မှာရှိတဲ့ regression line ရဲ့ slope အတွက် t-test ကို ဘယ်လိုလုပ်ဆောင်ရမလဲ
ကျွန်ုပ်တို့သည် ရိုးရှင်းသော မျဉ်းနားဆုတ်ယုတ်မှုတစ်ခုကို လုပ်ဆောင်သည်၊၊ ကျွန်ုပ်တို့သည် အောက်ပါ ခန့်မှန်းခြေဆုတ်ယုတ်မှုညီမျှခြင်းဖြင့် အဆုံးသတ်သည်-
ŷ = b 0 + b 1 x
slope coefficient၊ b 1 သည် ကိန်းဂဏန်းအရ သိသာမှုရှိမရှိ ယေဘုယျအားဖြင့် ကျွန်ုပ်တို့ သိလိုပါသည်။
b 1 သည် ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါ စစ်ဆေးမှု ကိန်းဂဏန်းများဖြင့် t-test ကို လုပ်ဆောင်နိုင်သည်-
t = b 1 / se(b 1 )
ရွှေ-
- se(b 1 ) သည် b 1 ၏ စံအမှားကို ကိုယ်စားပြုသည်။
ထို့နောက် ကျွန်ုပ်တို့သည် ဤစမ်းသပ်မှုကိန်းဂဏန်းနှင့် ကိုက်ညီသည့် p-value ကို လွတ်လပ်ခွင့်၏ n-2 ဒီဂရီဖြင့် တွက်ချက်နိုင်သည်။
p-value သည် သတ်မှတ်ထားသော အတိုင်းအတာတစ်ခုထက် နည်းနေပါက (ဥပမာ α = 0.05)၊ ထို့နောက် slope coefficient သည် သုညမဟုတ်ကြောင်း ကောက်ချက်ချနိုင်ပါသည်။
တစ်နည်းဆိုရသော်၊ ခန့်မှန်းသူကိန်းရှင်နှင့် မော်ဒယ်ရှိ တုံ့ပြန်မှုကိန်းရှင်တို့ ကြားတွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်ဆံရေးရှိသည်။
အောက်ဖော်ပြပါ ဥပမာသည် R ရှိ ဆုတ်ယုတ်မှုမျဉ်း၏ လျှောစောက်အတွက် t-test ကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။
ဥပမာ- R ရှိ ဆုတ်ယုတ်မှုမျဉ်း၏ လျှောစောက်အတွက် t-test ကို လုပ်ဆောင်ခြင်း။
အတန်းတစ်ခန်းတွင် ကျောင်းသား 12 ဦး အောင်မြင်သည့် နာရီများနှင့် နောက်ဆုံးစာမေးပွဲရမှတ်များအကြောင်း အချက်အလက်ပါဝင်သော R တွင် အောက်ပါဒေတာဘောင်တစ်ခုရှိသည် ဆိုပါစို့။
#create data frame df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8), score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82)) #view data frame df hours score 1 1 65 2 1 67 3 2 78 4 2 75 5 3 73 6 4 84 7 5 80 8 5 76 9 5 89 10 6 91 11 6 83 12 8 82
နာရီနှင့် စာမေးပွဲရမှတ်များကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှုရှိမရှိ ဆုံးဖြတ်ရန် ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်လိုသည်ဆိုကြပါစို့။
ဤဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် R တွင် lm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
#fit simple linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -7,398 -3,926 -1,139 4,972 7,713 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 67.7685 3.3757 20.075 2.07e-09 *** hours 2.7037 0.7456 3.626 0.00464 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.479 on 10 degrees of freedom Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641
မော်ဒယ်ရလဒ်များမှ ခန့်မှန်းခြေဆုတ်ယုတ်မှုညီမျှခြင်းမှာ-
စာမေးပွဲရမှတ် = 67.7685 + 2.7037 (နာရီ)၊
slope coefficient သည် ကိန်းဂဏန်းအရ သိသာမှုရှိမရှိ စမ်းသပ်ရန်၊ t-test statistic ကို အောက်ပါအတိုင်း တွက်ချက်နိုင်ပါသည်။
- t = b 1 / se(b 1 )
- t = 2.7037 / 0.7456
- t = 3.626
ဤ t-test ကိန်းဂဏန်းနှင့် ကိုက်ညီသော p-တန်ဖိုးကို အထွက်ရှိ Pr(> |t|) ဟုခေါ်သော ကော်လံတွင် ပြသထားသည်။
p-value သည် 0.00464 ဖြစ်သွားသည်။
ဤ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ slope coefficient သည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်ဟု ကျွန်ုပ်တို့ကောက်ချက်ချပါသည်။
တစ်နည်းဆိုရသော်၊ စာမေးပွဲတွင် ဖြေဆိုခဲ့သော ကျောင်းသားတစ်ဦး၏ နောက်ဆုံးတန်းကို လေ့လာသည့် နာရီအရေအတွက်နှင့် စာမေးပွဲတွင် ရရှိသည့် နောက်ဆုံးတန်းကြားတွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်ဆံရေးရှိသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် regression output ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ