R မှာရှိတဲ့ regression line ရဲ့ slope အတွက် t-test ကို ဘယ်လိုလုပ်ဆောင်ရမလဲ


ကျွန်ုပ်တို့သည် ရိုးရှင်းသော မျဉ်းနားဆုတ်ယုတ်မှုတစ်ခုကို လုပ်ဆောင်သည်၊၊ ကျွန်ုပ်တို့သည် အောက်ပါ ခန့်မှန်းခြေဆုတ်ယုတ်မှုညီမျှခြင်းဖြင့် အဆုံးသတ်သည်-

ŷ = b 0 + b 1 x

slope coefficient၊ b 1 သည် ကိန်းဂဏန်းအရ သိသာမှုရှိမရှိ ယေဘုယျအားဖြင့် ကျွန်ုပ်တို့ သိလိုပါသည်။

b 1 သည် ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါ စစ်ဆေးမှု ကိန်းဂဏန်းများဖြင့် t-test ကို လုပ်ဆောင်နိုင်သည်-

t = b 1 / se(b 1 )

ရွှေ-

  • se(b 1 ) သည် b 1 ၏ စံအမှားကို ကိုယ်စားပြုသည်။

ထို့နောက် ကျွန်ုပ်တို့သည် ဤစမ်းသပ်မှုကိန်းဂဏန်းနှင့် ကိုက်ညီသည့် p-value ကို လွတ်လပ်ခွင့်၏ n-2 ဒီဂရီဖြင့် တွက်ချက်နိုင်သည်။

p-value သည် သတ်မှတ်ထားသော အတိုင်းအတာတစ်ခုထက် နည်းနေပါက (ဥပမာ α = 0.05)၊ ထို့နောက် slope coefficient သည် သုညမဟုတ်ကြောင်း ကောက်ချက်ချနိုင်ပါသည်။

တစ်နည်းဆိုရသော်၊ ခန့်မှန်းသူကိန်းရှင်နှင့် မော်ဒယ်ရှိ တုံ့ပြန်မှုကိန်းရှင်တို့ ကြားတွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်ဆံရေးရှိသည်။

အောက်ဖော်ပြပါ ဥပမာသည် R ရှိ ဆုတ်ယုတ်မှုမျဉ်း၏ လျှောစောက်အတွက် t-test ကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။

ဥပမာ- R ရှိ ဆုတ်ယုတ်မှုမျဉ်း၏ လျှောစောက်အတွက် t-test ကို လုပ်ဆောင်ခြင်း။

အတန်းတစ်ခန်းတွင် ကျောင်းသား 12 ဦး အောင်မြင်သည့် နာရီများနှင့် နောက်ဆုံးစာမေးပွဲရမှတ်များအကြောင်း အချက်အလက်ပါဝင်သော R တွင် အောက်ပါဒေတာဘောင်တစ်ခုရှိသည် ဆိုပါစို့။

 #create data frame
df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8),
                 score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82))

#view data frame
df

   hours score
1 1 65
2 1 67
3 2 78
4 2 75
5 3 73
6 4 84
7 5 80
8 5 76
9 5 89
10 6 91
11 6 83
12 8 82

နာရီနှင့် စာမေးပွဲရမှတ်များကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ဆက်နွယ်မှုရှိမရှိ ဆုံးဖြတ်ရန် ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်လိုသည်ဆိုကြပါစို့။

ဤဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် R တွင် lm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

 #fit simple linear regression model
fit <- lm(score ~ hours, data=df)

#view model summary
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-7,398 -3,926 -1,139 4,972 7,713 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 67.7685 3.3757 20.075 2.07e-09 ***
hours 2.7037 0.7456 3.626 0.00464 ** 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.479 on 10 degrees of freedom
Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 
F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641

မော်ဒယ်ရလဒ်များမှ ခန့်မှန်းခြေဆုတ်ယုတ်မှုညီမျှခြင်းမှာ-

စာမေးပွဲရမှတ် = 67.7685 + 2.7037 (နာရီ)၊

slope coefficient သည် ကိန်းဂဏန်းအရ သိသာမှုရှိမရှိ စမ်းသပ်ရန်၊ t-test statistic ကို အောက်ပါအတိုင်း တွက်ချက်နိုင်ပါသည်။

  • t = b 1 / se(b 1 )
  • t = 2.7037 / 0.7456
  • t = 3.626

ဤ t-test ကိန်းဂဏန်းနှင့် ကိုက်ညီသော p-တန်ဖိုးကို အထွက်ရှိ Pr(> |t|) ဟုခေါ်သော ကော်လံတွင် ပြသထားသည်။

p-value သည် 0.00464 ဖြစ်သွားသည်။

ဤ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ slope coefficient သည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်ဟု ကျွန်ုပ်တို့ကောက်ချက်ချပါသည်။

တစ်နည်းဆိုရသော်၊ စာမေးပွဲတွင် ဖြေဆိုခဲ့သော ကျောင်းသားတစ်ဦး၏ နောက်ဆုံးတန်းကို လေ့လာသည့် နာရီအရေအတွက်နှင့် စာမေးပွဲတွင် ရရှိသည့် နောက်ဆုံးတန်းကြားတွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ဆက်ဆံရေးရှိသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် regression output ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်