R ဖြင့် နှစ်လမ်းသွား anova ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။


နှစ်လမ်းသွား ANOVA (“ ကွဲလွဲမှုကို ခွဲခြမ်းစိတ်ဖြာခြင်း” ) ကို အချက်နှစ်ချက်ခွဲပြီး ခွဲထုတ်ထားသော အမှီအခိုကင်းသော အုပ်စုသုံးစု သို့မဟုတ် ထို့ထက်မကသော အုပ်စုများကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုပါသည်။

ဤသင်ခန်းစာသည် R ဖြင့် နှစ်လမ်းသွား ANOVA ကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။

ဥပမာ- R in two-way ANOVA

လေ့ကျင့်ခန်း ပြင်းထန်မှုနှင့် လိင်မှုရေးရာ အကျိုးသက်ရောက်မှုရှိမရှိ ဆုံးဖြတ်ရန်လိုသည်ဆိုကြပါစို့။ ဤကိစ္စတွင်၊ ကျွန်ုပ်တို့ကြည့်နေသော အချက်နှစ်ချက်မှာ လေ့ကျင့်ခန်း နှင့် လိင်ကွဲပြားမှု ဖြစ်ပြီး တုံ့ပြန်မှုပုံစံမှာ ပေါင်ဖြင့်တိုင်းတာသည့် ကိုယ်အလေးချိန်ကျခြင်း ဖြစ်သည်။

လေ့ကျင့်ခန်းနှင့် ကျားမအပေါ် သက်ရောက်မှုရှိမရှိ ဆုံးဖြတ်ရန် နှစ်လမ်းသွား ANOVA ကို လုပ်ဆောင်နိုင်ပြီး ကိုယ်အလေးချိန် လျှော့ချရာတွင် လေ့ကျင့်ခန်းနှင့် ကျားမအကြား အပြန်အလှန် သက်ရောက်မှု ရှိမရှိ ဆုံးဖြတ်ရန် လုပ်ဆောင်နိုင်သည်။

ကျွန်ုပ်တို့သည် လေ့ကျင့်ခန်းမလုပ်ဘဲ၊ အပေါ့စားလေ့ကျင့်ခန်း သို့မဟုတ် အပြင်းအထန်လေ့ကျင့်ခန်းအစီအစဉ်ကို လိုက်နာရန် တစ်လတာ လေ့ကျင့်ခန်းပြုလုပ်ရန် 10 ဦးစီကို ကျပန်းတာဝန်ပေးသည့် စမ်းသပ်မှုတွင် ပါဝင်ရန် အမျိုးသား 30 နှင့် အမျိုးသမီး 30 ကို ခေါ်ယူနေပါသည်။

အောက်ပါကုဒ်သည် ကျွန်ုပ်တို့နှင့်အတူ လုပ်ဆောင်မည့် ဒေတာဘောင်ကို ဖန်တီးသည်-

 #make this example reproducible
set.seed(10)

#create data frame
data <- data.frame(gender = rep(c("Male", "Female"), each = 30),
                   exercise = rep(c("None", "Light", "Intense"), each = 10, times = 2),
                   weight_loss = c(runif(10, -3, 3), runif(10, 0, 5), runif(10, 5, 9),
                                   runif(10, -4, 2), runif(10, 0, 3), runif(10, 3, 8)))

#view first six rows of data frame
head(data)

# gender exercise weight_loss
#1 Male None 0.04486922
#2 Male None -1.15938896
#3 Male None -0.43855400
#4 Male None 1.15861249
#5 Male None -2.48918419
#6 Male None -1.64738030

#see how many participants are in each group
table(data$gender, data$exercise)

# Intense Light None
# Female 10 10 10
# Male 10 10 10

အချက်အလက်ကို စူးစမ်းပါ။

နှစ်လမ်းသွား ANOVA မော်ဒယ်ကိုပင် အံကိုက်မဖြစ်မီ၊ dplyr ပက်ကေ့ဂျ်ကို အသုံးပြု၍ ကုသမှုအုပ်စုခြောက်ခုစီအတွက် ကိုယ်အလေးချိန်ကျခြင်း၏ ပျမ်းမျှနှင့် စံသွေဖည်မှုကို ရှာဖွေခြင်းဖြင့် ဒေတာကို ပိုမိုကောင်းမွန်စွာ နားလည်နိုင်သည်-

 #load dplyr package
library(dplyr)

#find mean and standard deviation of weight loss for each treatment group
data %>%
  group_by (gender, exercise) %>%
  summarize (mean = mean(weight_loss),
            sd = sd(weight_loss))

# A tibble: 6 x 4
# Groups: gender [2]
# gender exercise means sd
#          
#1 Female Intense 5.31 1.02 
#2 Female Light 0.920 0.835
#3 Female None -0.501 1.77 
#4 Male Intense 7.37 0.928
#5 Male Light 2.13 1.22 
#6 Male None -0.698 1.12 

အဖွဲ့တစ်ဖွဲ့ချင်းစီအတွက် ကိုယ်အလေးချိန် လျှော့ချခြင်းကို မြင်သာစေရန် ကုသမှုအုပ်စုခြောက်ခုစီအတွက် boxplot တစ်ခုကိုလည်း ဖန်တီးနိုင်သည်-

 #set margins so that axis labels on boxplot don't get cut off
by(mar=c(8, 4.1, 4.1, 2.1))

#create boxplots
boxplot(weight_loss ~ gender:exercise,
data = data,
main = "Weight Loss Distribution by Group",
xlab = "Group",
ylab = "Weight Loss",
col = "steelblue",
border = "black", 
las = 2 #make x-axis labels perpendicular
)

ပြင်းထန်သော လေ့ကျင့်ခန်းတွင် ပါဝင်သည့် အုပ်စုနှစ်စုသည် ကိုယ်အလေးချိန် လျှော့ချခြင်း တန်ဖိုးများ ပိုမိုမြင့်မားပုံပေါ်ကြောင်း ကျွန်ုပ်တို့ ချက်ချင်း သိမြင်နိုင်ပါသည်။ ပြင်းထန်သော နှင့် ပေါ့ပါးသော လေ့ကျင့်ခန်း အုပ်စု နှစ်ခု စလုံးတွင် အမျိုးသား များသည် အမျိုးသမီးများ ထက် ကိုယ်အလေးချိန် ကျဆင်းမှု တန်ဖိုး ပိုများကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်သည်။

ထို့နောက်၊ ဤမြင်ယောင်ကွဲပြားမှုများသည် အမှန်တကယ်တွင် စာရင်းအင်းအရ သိသာထင်ရှားခြင်းရှိမရှိ ကြည့်ရှုရန် နှစ်လမ်းသွား ANOVA မော်ဒယ်ကို ကျွန်ုပ်တို့၏ဒေတာနှင့် အံဝင်ခွင်ကျဖြစ်စေပါမည်။

နှစ်လမ်းသွား ANOVA မော်ဒယ်နှင့် လိုက်ဖက်သည်။

R တွင် နှစ်လမ်းသွား ANOVA မော်ဒယ်နှင့် အံဝင်ခွင်ကျအတွက် ယေဘူယျ syntax သည်-

aov(response variable ~predictor_variable1 *predictor_variable2၊ data = dataset)

ကြိုတင်ခန့်မှန်းကိန်းရှင်နှစ်ခုကြားရှိ * သည် ခန့်မှန်းသူကိန်းရှင်နှစ်ခုကြား အပြန်အလှန်အကျိုးသက်ရောက်မှုအတွက်လည်း ကျွန်ုပ်တို့စမ်းသပ်လိုကြောင်း သတိပြုပါ။

ကျွန်ုပ်တို့၏ဥပမာတွင်၊ ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် weight_loss နှင့် ကျား-မ နှင့် လေ့ကျင့်ခန်းကို ကြိုတင်ခန့်မှန်းကိန်းရှင်နှစ်ခုအဖြစ် အသုံးပြု၍ နှစ်လမ်း ANOVA မော်ဒယ်နှင့်ကိုက်ညီရန် အောက်ပါကုဒ်ကိုသုံးနိုင်သည်။

ထို့နောက် ကျွန်ုပ်တို့၏မော်ဒယ်ရလဒ်ကိုပြသရန် summary() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 #fit the two-way ANOVA model
model <- aov(weight_loss ~ gender * exercise, data = data)

#view the model output
summary(model)

# Df Sum Sq Mean Sq F value Pr(>F)    
#gender 1 15.8 15.80 11.197 0.0015 ** 
#exercise 2 505.6 252.78 179.087 <2e-16 ***
#gender:exercise 2 13.0 6.51 4.615 0.0141 *  
#Residuals 54 76.2 1.41                   
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

မော်ဒယ်ရလဒ်များမှ၊ ကျား ၊မ၊ လေ့ကျင့်ခန်း နှင့် ကိန်းရှင်နှစ်ခုကြား အပြန်အလှန်အကျိုးသက်ရောက်မှုသည် 0.05 အရေးပါမှုအဆင့်တွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

မော်ဒယ်ယူဆချက်များကို စစ်ဆေးခြင်း။

ကျွန်ုပ်တို့ ရှေ့ဆက်မသွားမီ၊ ကျွန်ုပ်တို့၏ မော်ဒယ်ရလဒ်များသည် ယုံကြည်စိတ်ချနိုင်စေရန် ကျွန်ုပ်တို့၏ မော်ဒယ်၏ ယူဆချက်များနှင့် ကိုက်ညီကြောင်း အတည်ပြုရန် လိုအပ်ပါသည်။ အထူးသဖြင့်၊ နှစ်လမ်းသွား ANOVA က ယူဆသည်-

1. လွတ်လပ်ရေး – အဖွဲ့တစ်ခုစီ၏ ရှုမြင်သုံးသပ်ချက်များသည် တစ်ခုနှင့်တစ်ခု အမှီအခိုကင်းရမည်။ ကျွန်ုပ်တို့သည် ကျပန်းပုံစံဒီဇိုင်းကို အသုံးပြုထားသောကြောင့် ဤယူဆချက်နှင့် ကိုက်ညီသင့်သည်၊ ထို့ကြောင့် ကျွန်ုပ်တို့သည် ၎င်းအတွက် အလွန်စိုးရိမ်နေစရာမလိုပါ။

2. Normality – မှီခိုကိန်းရှင်သည် အချက်နှစ်ရပ်၏ အုပ်စုတစ်ခုစီ၏ ပေါင်းစပ်မှုတစ်ခုစီအတွက် ခန့်မှန်းခြေ ပုံမှန်ဖြန့်ဝေမှု ရှိသင့်သည်။

ဤယူဆချက်ကို စမ်းသပ်ရန် နည်းလမ်းတစ်ခုမှာ မော်ဒယ်အကြွင်းအကျန်များ၏ ဟီစတိုဂရမ်ကို ဖန်တီးရန်ဖြစ်သည်။ အကြွင်းအကျန်များကို ခန့်မှန်းခြေအားဖြင့် ပုံမှန်ဖြန့်ဝေပါက၊ ဤယူဆချက်ကို ကျေနပ်သင့်သည်။

 #define model residuals
reside <- model$residuals

#create histogram of residuals
hist(resid, main = "Histogram of Residuals", xlab = "Residuals", col = "steelblue")

အကြွင်းအကျန်များကို ခန့်မှန်းခြေအားဖြင့် ပုံမှန်ဖြန့်ဝေထားသောကြောင့် ပုံမှန်ဖြစ်ရိုးဖြစ်စဉ် ယူဆချက်နှင့် ကိုက်ညီသည်ဟု ကျွန်ုပ်တို့ ယူဆနိုင်ပါသည်။

3. တူညီသောကွဲလွဲမှု – အုပ်စုတစ်ခုစီအတွက် ကွဲလွဲမှုများသည် တူညီသည် သို့မဟုတ် ခန့်မှန်းခြေအားဖြင့် တူညီသည်။

ဤယူဆချက်ကို စစ်ဆေးရန် နည်းလမ်းတစ်ခုမှာ ကား ပက်ကေ့ခ်ျကို အသုံးပြု၍ ကွဲပြားမှုများ၏ တန်းတူညီမျှမှုအတွက် Levene စမ်းသပ်မှုကို လုပ်ဆောင်ရန်ဖြစ်သည်-

 #load car package
library(car)

#conduct Levene's Test for equality of variances
leveneTest(weight_loss ~ gender * exercise, data = data)

#Levene's Test for Homogeneity of Variance (center = median)
# Df F value Pr(>F)
#group 5 1.8547 0.1177
#54  

စာမေးပွဲ၏ p-value သည် ကျွန်ုပ်တို့၏ အရေးပါမှုအဆင့် 0.05 ထက် ကြီးသောကြောင့်၊ အုပ်စုများကြား ကွဲလွဲမှုများ၏ တန်းတူညီမျှမှုဆိုင်ရာ ကျွန်ုပ်တို့၏ ယူဆချက်သည် ကိုက်ညီသည်ဟု ကျွန်ုပ်တို့ ယူဆနိုင်ပါသည်။

ကုသမှုကွာခြားချက်များကို ခွဲခြမ်းစိတ်ဖြာပါ။

စံပြယူဆချက်များနှင့်ကိုက်ညီကြောင်း စစ်ဆေးအတည်ပြုပြီးသည်နှင့် မည်သည့်ကုသမှုအုပ်စုများ တစ်ခုနှင့်တစ်ခု ကွဲပြားသည်ကို အတိအကျဆုံးဖြတ်ရန် post hoc test ပြုလုပ်နိုင်ပါသည်။

ကျွန်ုပ်တို့၏ post hoc စာမေးပွဲအတွက်၊ ကျွန်ုပ်တို့သည် နှိုင်းယှဉ်မှုများစွာအတွက် Tukey စမ်းသပ်မှုကို လုပ်ဆောင်ရန် TukeyHSD() လုပ်ဆောင်ချက်ကို အသုံးပြုပါမည်။

 #perform Tukey's Test for multiple comparisons
TukeyHSD(model, conf.level=.95) 

#Tukey multiple comparisons of means
# 95% family-wise confidence level
#
#Fit: aov(formula = weight_loss ~ gender * exercise, data = data)
#
#$gender
# diff lwr upr p adj
#Male-Female 1.026456 0.4114451 1.641467 0.0014967
#
#$exercise
# diff lwr upr p adj
#Light-Intense -4.813064 -5.718493 -3.907635 0.0e+00
#None-Intense -6.938966 -7.844395 -6.033537 0.0e+00
#None-Light -2.125902 -3.031331 -1.220473 1.8e-06
#
#$`gender:exercise`
# diff lwr upr p adj
#Male:Intense-Female:Intense 2.0628297 0.4930588 3.63260067 0.0036746
#Female:Light-Female:Intense -4.3883563 -5.9581272 -2.81858535 0.0000000
#Male:Light-Female:Intense -3.1749419 -4.7447128 -1.60517092 0.0000027
#Female:None-Female:Intense -5.8091131 -7.3788841 -4.23934219 0.0000000
#Male:None-Female:Intense -6.0059891 -7.5757600 -4.43621813 0.0000000
#Female:Light-Male:Intense -6.4511860 -8.0209570 -4.88141508 0.0000000
#Male:Light-Male:Intense -5.2377716 -6.8075425 -3.66800066 0.0000000
#Female:None-Male:Intense -7.8719429 -9.4417138 -6.30217192 0.0000000
#Male:None-Male:Intense -8.0688188 -9.6385897 -6.49904786 0.0000000
#Male:Light-Female:Light 1.2134144 -0.3563565 2.78318536 0.2185439
#Female:None-Female:Light -1.4207568 -2.9905278 0.14901410 0.0974193
#Male:None-Female:Light -1.6176328 -3.1874037 -0.04786184 0.0398106
#Female:None-Male:Light -2.6341713 -4.2039422 -1.06440032 0.0001050
#Male:None-Male:Light -2.8310472 -4.4008181 -1.26127627 0.0000284
#Male:None-Female:None -0.1968759 -1.7666469 1.37289500 0.9990364

p-value သည် အုပ်စုတစ်ခုစီကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ရှိမရှိကို ညွှန်ပြသည်။

ဥပမာအားဖြင့်၊ အထက်ဖော်ပြပါ နောက်ဆုံးအတန်းတွင်၊ လေ့ကျင့်ခန်းမလုပ်သော အမျိုးသားအုပ်စုသည် အမျိုးသမီးများ လေ့ကျင့်ခန်းမလုပ်သောအုပ်စုနှင့် နှိုင်းယှဉ်ပါက ကိုယ်အလေးချိန်လျှော့ချရာတွင် ကိန်းဂဏန်းအချက်အလတ် သိသိသာသာ ကွာခြားမှုမရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်ရသည် (p-value: 0.990364)။

R တွင် plot() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Tukey စမ်းသပ်မှုမှ ထွက်ပေါ်လာသည့် ယုံကြည်မှု 95% ကြားကာလကိုလည်း မြင်ယောင်နိုင်သည်-

 #set axis margins so labels don't get cut off
by(mar=c(4.1, 13, 4.1, 2.1))

#create confidence interval for each comparison
plot(TukeyHSD(model, conf.level=.95), las = 2)

နှစ်လမ်းသွား ANOVA ရလဒ်များကို အစီရင်ခံခြင်း။

နောက်ဆုံးတွင်၊ နှစ်လမ်းသွား ANOVA ၏ရလဒ်များကို ရလဒ်များကို အကျဉ်းချုပ်ဖော်ပြသည့်နည်းလမ်းဖြင့် ကျွန်ုပ်တို့ အစီရင်ခံနိုင်ပါသည်။

ANOVA သည် ကျား၊မ ( အမျိုးသား၊ အမျိုးသမီး) နှင့် ကိုယ်အလေးချိန်ကျခြင်းဆိုင်ရာ အစီအစဉ် (အဘယ်သူမျှမ၊ ပေါ့ပါး၊ ပြင်းထန်) (ပေါင်ဖြင့်တိုင်းတာသည်) ၏သက်ရောက်မှုများကို စစ်ဆေးရန် နှစ်လမ်းသွား ANOVA ကို လုပ်ဆောင်ခဲ့သည်။ ကျား-မ နှင့် လေ့ကျင့်ခန်း၏ အကျိုးသက်ရောက်မှုများကြားတွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော အပြန်အလှန်အကျိုးသက်ရောက်မှုများ (F(2, 54) = 4.615၊ p = 0.0141)။ Post-hoc Tukey ၏ HSD စမ်းသပ်မှုများကို ပြုလုပ်ခဲ့သည်။

အမျိုးသားများအတွက်၊ ပြင်းထန်သော လေ့ကျင့်ခန်းအစီအစဉ်တစ်ခုသည် အပေါ့စား အစီအစဉ် (p < 0.0001) သို့မဟုတ် လေ့ကျင့်ခန်းအစီအစဉ်မရှိ (p < 0.0001) ထက် သိသိသာသာ ကိုယ်အလေးချိန်ကျစေပါသည်။ ထို့အပြင်၊ အမျိုးသားများတွင် ပေါ့ပေါ့ပါးပါး စားသောက်ခြင်းသည် လေ့ကျင့်ခန်းမလုပ်ခြင်း ထက် သိသိသာသာ ကိုယ်အလေးချိန် လျော့ကျစေသည် (p < 0.0001)။

အမျိုးသမီးများအတွက်၊ ပြင်းထန်သော လေ့ကျင့်ခန်းအစီအစဉ်တစ်ခုသည် အပေါ့စား အစီအစဉ် (p < 0.0001) သို့မဟုတ် လေ့ကျင့်ခန်းအစီအစဉ်မရှိ (p < 0.0001) ထက် သိသိသာသာ ကိုယ်အလေးချိန်ကျစေပါသည်။

ပုံမှန်စစ်ဆေးမှုများနှင့် ANOVA ၏ယူဆချက်များနှင့်ကိုက်ညီကြောင်းအတည်ပြုရန် Levene စမ်းသပ်မှုကိုလုပ်ဆောင်ခဲ့သည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်