R တွင်တွဲထားသောနမူနာများကို t-test လုပ်နည်း


တွဲထားသောနမူနာ t-test သည် နမူနာတစ်ခုမှ စူးစမ်းမှုတစ်ခုစီမှ အခြားနမူနာတစ်ခုမှ စူးစမ်းမှု တစ်ခုနှင့် ကိုက်ညီသောအခါတွင် နမူနာနှစ်ခု၏နည်းလမ်းကို နှိုင်းယှဉ်သည့် ကိန်းဂဏန်းစမ်းသပ်မှုတစ်ခုဖြစ်သည်။

ဥပမာအားဖြင့်၊ အချို့သော သင်ရိုးညွှန်းတမ်းသည် စာမေးပွဲတစ်ခုတွင် ကျောင်းသားများ၏ စွမ်းဆောင်ရည်အပေါ် သိသာထင်ရှားစွာ သက်ရောက်မှုရှိမရှိ သိချင်သည်ဆိုကြပါစို့။ ဒါကို စမ်းသပ်ဖို့အတွက် အတန်းတစ်ခန်းမှာ ကျောင်းသား အယောက် ၂၀ ကို အကြိုစာမေးပွဲ ဖြေခိုင်းပါတယ်။ ထို့နောက် ကျောင်းသားတစ်ဦးစီသည် သီတင်းနှစ်ပတ်ကြာ လေ့လာမှုအစီအစဉ်တွင် နေ့စဉ်ပါဝင်ပါသည်။ ထို့နောက် ကျောင်းသားများသည် အလားတူအခက် အခဲများကို ဖြေဆိုကြရသည်။

ပထမစာမေးပွဲတွင် ပျမ်းမျှရမှတ်များအကြား ကွာခြားချက်ကို နှိုင်းယှဉ်ရန် ကျောင်းသားတစ်ဦးစီအတွက် ပထမစာမေးပွဲတွင် ၎င်းတို့၏ရမှတ်များသည် ဒုတိယစာမေးပွဲတွင် ၎င်းတို့၏ရမှတ်များနှင့် ဆက်စပ်နိုင်သောကြောင့် တွဲထားသော t-test ကို အသုံးပြုပါသည်။

Paired t test ကို ဘယ်လိုလုပ်ဆောင်ရမလဲ

တွဲထားသော t-test ကိုလုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါနည်းလမ်းကို အသုံးပြုနိုင်ပါသည်။

အဆင့် 1- null နှင့် အခြားအခြားသော အယူအဆများကို ဖော်ပြပါ။

H 0 : μ d = 0

H a : μ d ≠ 0 (တစ်ဖက်သတ်)
H a : μ d > 0 (တစ်ဖက်သတ်)
H a : μ d < 0 (တစ်ဖက်သတ်)

µ d သည် ပျမ်းမျှ ခြားနားချက် ဖြစ်သည် ။

အဆင့် 2- စမ်းသပ်စာရင်းအင်းနှင့် သက်ဆိုင်ရာ p-value ကို ရှာပါ။

a = ပထမ စာမေးပွဲတွင် ကျောင်းသား၏ ရမှတ်နှင့် b = ဒုတိယ စာမေးပွဲတွင် ကျောင်းသား၏ ရမှတ်ကို ကြည့်ပါ။ စာမေးပွဲရမှတ်များအကြား စစ်မှန်သောပျမ်းမျှကွာခြားချက်မှာ သုညဖြစ်သည်ဟူသော null အယူအဆကို စမ်းသပ်ရန်-

  • ရမှတ်တစ်စုံစီကြား ခြားနားချက်ကို တွက်ချက်ပါ (d i = b i – a i )
  • ပျမ်းမျှခြားနားချက်ကို တွက်ချက်ပါ (ဃ)
  • ကွဲပြားမှုများ၏ စံသွေဖည်မှု s ဃ ကို တွက်ချက်ပါ။
  • T = d / (s d / √n) ဖြစ်သည့် t ကိန်းဂဏန်းကို တွက်ချက်ပါ။
  • လွတ်လပ်မှု N-1 ဒီဂရီဖြင့် t-ကိန်းဂဏန်းအတွက် သက်ဆိုင်သော p-တန်ဖိုးကို ရှာပါ။

အဆင့် 3- အရေးပါမှုအဆင့်ပေါ်အခြေခံ၍ null hypothesis ကို ငြင်းပယ်ခြင်း သို့မဟုတ် ငြင်းပယ်ခြင်းမပြုပါနှင့်။

p-value သည် ရွေးချယ်ထားသော အရေးပါမှုအဆင့်ထက် လျော့နည်းပါက၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်ပြီး အုပ်စုနှစ်ခု၏ နည်းလမ်းများကြားတွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ကွာခြားချက်ရှိနေသည်ဟု ကောက်ချက်ချပါသည်။ မဟုတ်ပါက၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်မည်ဖြစ်ပါသည်။

R တွင် တွဲထားသော t test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။

R တွင် တွဲထားသော t test ကို လုပ်ဆောင်ရန်၊ အောက်ပါ syntax ဖြင့် built-in function t.test() ကို သုံးနိုင်သည်-

t.test (x၊ y၊ တွဲထားသည် = TRUE၊ အစားထိုး = “နှစ်ဖက်”)

  • x၊y- ကျွန်ုပ်တို့ နှိုင်းယှဉ်လိုသော ဒစ်ဂျစ်တယ် ကွက်နှစ်ခု
  • တွဲထားသည်- ကျွန်ုပ်တို့ တွဲထားသော t-test ကို တွက်ချက်လိုကြောင်း သတ်မှတ်သည့် ယုတ္တိတန်ဖိုး
  • အခြားရွေးချယ်စရာ- အခြားယူဆချက်။ ၎င်းကို “ ဘက်နှစ်ထပ်” (မူလ)၊ “ အပေါ်” သို့မဟုတ် “ အောက်ခြေ” ဟု သတ်မှတ်နိုင်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် ကျောင်းသား 20 အတွက် အကြိုစာမေးပွဲနှင့် စာမေးပွဲအပြီး စာမေးပွဲကြားတွင် ပျမ်းမျှရမှတ်များ သိသိသာသာကွာခြားမှုရှိမရှိ ဆုံးဖြတ်ရန် တွဲထားသော t-test ကို မည်သို့လုပ်ဆောင်ရမည်ကို သရုပ်ဖော်ထားပါသည်။

ဒေတာကိုဖန်တီးပါ။

ပထမဦးစွာ၊ ကျွန်ုပ်တို့သည် dataset ကိုဖန်တီးပါမည်-

 #create the dataset
data <- data.frame(score = c(85,85, 78, 78, 92, 94, 91, 85, 72, 97,
                             84, 95, 99, 80, 90, 88, 95, 90, 96, 89,
                             84, 88, 88, 90, 92, 93, 91, 85, 80, 93,
                             97, 100, 93, 91, 90, 87, 94, 83, 92, 95),
                   group = c(rep('pre', 20), rep('post', 20)))

#view the dataset
data

#scoregroup
#1 85 pre
#2 85 pre
#3 78 pre
#4 78 pre
#5 92 pre
#6 94 pre
#7 91 pre
#8 85 pre
#9 72 pre
#10 97 pre
#11 84 pre
#12 95 pre
#13 99 pre
#14 80 pre
#15 90 pre
#16 88 pre
#17 95 pre
#18 90 pre
#19 96 pre
#20 89 pre
#21 84 post
#22 88 post
#23 88 post
#24 90 post
#25 92 post
#26 93 post
#27 91 post
#28 85 post
#29 80 post
#30 93 post
#31 97 post
#32 100 posts
#33 93 post
#34 91 post
#35 90 post
#36 87 post
#37 94 post
#38 83 post
#39 92 post
#40 95 post

ကွဲပြားမှုများကို မြင်ယောင်ကြည့်ပါ။

ထို့နောက်၊ dplyr စာကြည့်တိုက်မှ group_by() နှင့် summary () လုပ်ဆောင်ချက်များကို အသုံးပြုထားသော အဖွဲ့နှစ်ဖွဲ့၏ အကျဉ်းချုပ်စာရင်းဇယားကို ကြည့်ရှုပါမည်။

 #load dplyr library
library(dplyr)

#find sample size, mean, and standard deviation for each group
data %>%
group_by (group) %>%
  summarize (
    count = n(),
    mean = mean(score),
    sd = sd(score)
  )

# A tibble: 2 x 4
# group count mean sd
#     
#1 post 20 90.3 4.88
#2 pre 20 88.2 7.24

အကြိုနှင့် ပို့စ်အုပ်စုများအတွက် ရမှတ်များခွဲဝေမှုကိုပြသရန် R ရှိ boxplot() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ boxplot များကို ဖန်တီးနိုင်သည်။

 boxplot (score~group,
  data=data,
  main="Test Scores by Group",
  xlab="Group",
  ylab="Score",
  col="steelblue",
  border="black"
)

အနှစ်ချုပ်စာရင်းဇယားများနှင့် အကွက်ကွက်များမှ၊ ပို့စ် အုပ်စုရှိ ပျမ်းမျှရမှတ်သည် အကြို အုပ်စုရှိ ပျမ်းမျှရမှတ်ထက် အနည်းငယ်ပိုမိုမြင့်မားသည်ကို ကျွန်ုပ်တို့တွေ့နိုင်သည်။ ပို့စ် အုပ်စုရမှတ်များသည် အုပ်စု အကြို ရမှတ်များထက် ကွဲလွဲမှုနည်းသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်။

ဤအုပ်စုနှစ်စု၏ အဓိပ္ပါယ်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်းရှိ၊ မရှိ သိရှိရန်၊ ကျွန်ုပ်တို့သည် တွဲထားသော t စမ်းသပ်မှုကို လုပ်ဆောင်နိုင်သည်။

တွဲထားသော t-test ကိုလုပ်ပါ။

တွဲထားသော t စမ်းသပ်မှုကို မလုပ်ဆောင်မီ၊ ကွဲပြားမှုများကို ဖြန့်ဝေမှုသည် ပုံမှန် (သို့မဟုတ် ခန့်မှန်းခြေအားဖြင့် ပုံမှန်အတိုင်း) ဖြန့်ဝေကြောင်း အတည်ပြုရန် လိုအပ်ပါသည်။ ဒါကိုလုပ်ဖို့၊ အကြိုနဲ့ ပို့စ်ရမှတ်တွေကြား ခြားနားချက်အဖြစ် သတ်မှတ်ထားတဲ့ vector အသစ်တစ်ခုကို ဖန်တီးပြီး ဒီတန်ဖိုးတွေရဲ့ ပုံမှန်အနေအထားအတွက် Shapiro-Wilk စမ်းသပ်မှုကို လုပ်ဆောင်နိုင်ပါတယ်။

 #define new vector for difference between post and pre scores
differences <- with(data, score[group == "post"] - score[group == "pre"])

#perform shapiro-wilk test for normality on this vector of values
shapiro.test(differences)

# Shapiro-Wilk normality test
#
#data: differences
#W = 0.92307, p-value = 0.1135
#

စစ်ဆေးမှု၏ p-value သည် 0.1135 ဖြစ်ပြီး alpha = 0.05 ထက် ကြီးသည်။ ထို့ကြောင့်၊ ကျွန်ုပ်တို့၏ဒေတာကို ပုံမှန်ဖြန့်ဝေနေသည်ဟူသော null hypothesis ကို ငြင်းပယ်ရန်ပျက်ကွက်ပါသည်။ ဆိုလိုသည်မှာ ယခုတွဲထားသော t-test ကို ဆက်လက်လုပ်ဆောင်နိုင်ပြီဖြစ်သည်။

တွဲထားသော t-test ကိုလုပ်ဆောင်ရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

 t.test (score~group, data = data, paired = TRUE)

# Paired t-test
#
#data: score by group
#t = 1.588, df = 19, p-value = 0.1288
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
# -0.6837307 4.9837307
#sample estimates:
#mean of the differences 
#2.15 

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • t- test ကိန်းဂဏန်းသည် 1.588 ဖြစ်သည်။
  • လွတ်လပ်မှု 19 ဒီဂရီ (df) နှင့် ဤစမ်းသပ်မှုကိန်းဂဏန်းအတွက် p-တန်ဖိုးသည် 0.1288 ဖြစ်သည်။
  • ပျမ်းမျှကွာခြားချက်အတွက် 95% ယုံကြည်မှုကြားကာလသည် (-0.6837၊ 4.9837) ဖြစ်သည်။
  • အကြိုနှင့်ပို့စ်အုပ်စု၏ ရမှတ်များအကြား ပျမ်းမျှကွာခြားချက်မှာ 2.15 ဖြစ်သည်။

ထို့ကြောင့်၊ ကျွန်ုပ်တို့၏ p-value သည် ကျွန်ုပ်တို့၏ အရေးပါမှုအဆင့် 0.05 အောက်တွင် ရှိနေသောကြောင့်၊ အုပ်စုနှစ်စုသည် စာရင်းအင်းအရ သိသာထင်ရှားသော အဓိပ္ပာယ်ရှိသည့် အုပ်စုနှစ်ခုဖြစ်သည့် null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်မည်ဖြစ်ပါသည်။

တစ်နည်းဆိုရသော်၊ အကြိုနှင့် ပို့စ်အုပ်စုများအကြား ပျမ်းမျှရမှတ်များသည် ကိန်းဂဏန်းအရ ကွဲပြားသည်ဟုဆိုရန် လုံလောက်သော အထောက်အထားမရှိပါ။ ဆိုလိုသည်မှာ သင်ရိုးညွှန်းတမ်းသည် စာမေးပွဲရမှတ်များအပေါ် သိသာထင်ရှားစွာ သက်ရောက်မှုမရှိဟု ဆိုလိုသည်။

ထို့အပြင်၊ ကျွန်ုပ်တို့၏ 95% ယုံကြည်မှုကြားကာလသည် အုပ်စုနှစ်ခုကြားရှိ စစ်မှန်သောပျမ်းမျှကွာခြားချက်မှာ -0.6837 နှင့် 4.9837 အကြားဖြစ်သည်ကို ကျွန်ုပ်တို့ “ 95% ယုံကြည်မှု” ရှိကြောင်း ညွှန်ပြပါသည်။

တန်ဖိုး သုည ကို ဤယုံကြည်မှုကြားကာလတွင် ပါ၀င်သောကြောင့်၊ ဆိုလိုသည်မှာ သုညသည် ပျမ်းမျှရမှတ်များကြားတွင် အမှန်တကယ် ခြားနားချက် ဖြစ်နိုင်သည်၊ ထို့ကြောင့် ဤကိစ္စရပ်တွင် null hypothesis ကို ကျွန်ုပ်တို့ ငြင်းပယ်ခြင်း မရှိခဲ့ပါ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်