R ဖြင့် သုံးလမ်းသွား anova ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။


သုံးလမ်းသွား ANOVA ကို အချက်သုံးချက်ဖြင့် ဖြန့်ဝေထားသော အမှီအခိုကင်းသော အုပ်စုသုံးစု သို့မဟုတ် ထို့ထက်မကသော အုပ်စုများအကြား စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုပါသည်။

အောက်ပါဥပမာသည် R တွင် သုံးလမ်းသွား ANOVA ကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။

ဥပမာ- R in သုံးလမ်း ANOVA

လေ့ကျင့်ရေးအစီအစဉ်နှစ်ခုသည် ကောလိပ်ဘတ်စကက်ဘောကစားသမားများကြား ခုန်အမြင့် ပျမ်းမျှတိုးတက်မှုကို ဖြစ်ပေါ်စေခြင်းရှိမရှိ သုတေသီတစ်ဦးမှ ဆုံးဖြတ်လိုသည်ဆိုပါစို့။

ကျား/မ ကွဲပြားခြင်း (Division I သို့မဟုတ် II) သည် အမြင့်ခုန်ခြင်းအပေါ် သက်ရောက်မှုရှိနိုင်သည်ဟု သုတေသီက သံသယရှိသောကြောင့် ဤအချက်များနှင့် ပတ်သက်သော အချက်အလက်များကို စုဆောင်းခဲ့သည်။

သူ၏ ရည်မှန်းချက်မှာ လေ့ကျင့်ရေးအစီအစဉ်၊ ကျား၊ မ နှင့် ကွဲပြားမှုအပေါ် မည်ကဲ့သို့ ခုန်အမြင့်ကို သက်ရောက်သည်ကို ဆုံးဖြတ်ရန် သုံးလမ်း ANOVA ကို လုပ်ဆောင်ရန်ဖြစ်သည်။

ဤသုံးနည်း ANOVA ကို R တွင်လုပ်ဆောင်ရန် အောက်ပါအဆင့်များကို လိုက်နာပါ။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ပထမဦးစွာ၊ ဒေတာကိုထိန်းထားရန် ဒေတာဘောင်တစ်ခု ဖန်တီးကြပါစို့။

 #create dataset
df <- data. frame (program=rep(c(1, 2), each= 20 ),
                 gender=rep(c(' M ', ' F '), each= 10 , times= 2 ),
                 division=rep(c(1, 2), each= 5 , times= 4 ),
                 height=c(7, 7, 8, 8, 7, 6, 6, 5, 6, 5,
                          5, 5, 4, 5, 4, 3, 3, 4, 3, 3,
                          6, 6, 5, 4, 5, 4, 5, 4, 4, 3,
                          2, 2, 1, 4, 4, 2, 1, 1, 2, 1)) 

#view first six rows of dataset
head(df)

  program gender division height
1 1 M 1 7
2 1 M 1 7
3 1 M 1 8
4 1 M 1 8
5 1 M 1 7
6 1 M 2 6

အဆင့် 2- ဖော်ပြချက်စာရင်းဇယားများကို ကြည့်ပါ။

သုံးလမ်းသွား ANOVA ကို မလုပ်ဆောင်မီ၊ လေ့ကျင့်ရေးအစီအစဉ်၊ ကျား၊ မ နှင့် အပိုင်းအလိုက် အုပ်စုဖွဲ့ထားသော ပျမ်းမျှခုန်နှုန်းတိုးနှုန်းကို လျင်မြန်စွာ အကျဉ်းချုပ်ဖော်ပြရန် dplyr ကို အသုံးပြုနိုင်ပါသည်။

 library (dplyr)

#calculate mean jumping height increase grouped by program, gender, and division
df %>%
  group_by(program, gender, division) %>%
  summarize(mean_height = mean(height))

# A tibble: 8 x 4
# Groups: program, gender [4]
  program gender division mean_height
                 
1 1 F 1 4.6
2 1 F 2 3.2
3 1 M 1 7.4
4 1 M 2 5.6
5 2 F 1 2.6
6 2 F 2 1.4
7 2 M 1 5.2
8 2 M 2 4  

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • Training Program 1 ကိုအသုံးပြုသော Division I အမျိုးသမီးများအတွက် ပျမ်းမျှခုန်နှုန်းသည် 4.6 လက်မ ဖြစ်သည်။
  • Training Program 1 ကိုအသုံးပြုသော Division II အမျိုးသမီးများတွင် ပျမ်းမျှခုန်နှုန်းသည် 3.2 လက်မ ဖြစ်သည်။
  • Training Program 1 ကိုအသုံးပြုသော Division I အမျိုးသားများအကြား ပျမ်းမျှခုန်နှုန်းသည် 7.4 လက်မ ဖြစ်သည်။

နောက် … ပြီးတော့။

အဆင့် 3- ANOVA သုံးရပ်ကို လုပ်ဆောင်ပါ။

နောက်တစ်ခု၊ သုံးလမ်း ANOVA ကိုလုပ်ဆောင်ရန် aov() လုပ်ဆောင်ချက်ကိုသုံးနိုင်သည်။

 #perform three-way ANOVA
model <- aov(height ~ program * gender * division, data=df)

#view summary of three-way ANOVA
summary(model)

                        Df Sum Sq Mean Sq F value Pr(>F)    
program 1 36.1 36.10 65.636 2.98e-09 ***
gender 1 67.6 67.60 122.909 1.71e-12 ***
division 1 19.6 19.60 35.636 1.19e-06 ***
program:gender 1 0.0 0.00 0.000 1.000    
program:division 1 0.4 0.40 0.727 0.400    
gender:division 1 0.1 0.10 0.182 0.673    
program:gender:division 1 0.1 0.10 0.182 0.673    
Residuals 32 17.6 0.55                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Pr(>F) ကော်လံသည် အချက်တစ်ခုချင်းစီအတွက် p-value နှင့် အချက်များကြား အပြန်အလှန်အကျိုးသက်ရောက်မှုများကို ပြသသည်။

ရလဒ်များမှ၊ အချက်သုံးချက်အကြား အပြန်အလှန်အကျိုးသက်ရောက်မှုများသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားမှုမရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ပရိုဂရမ်၊ ကျား၊ မ နှင့် ကွဲပြားခြင်း စသည့် အချက်သုံးချက်စီသည် ကိန်းဂဏန်းအရ အရေးပါသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်။

ပရိုဂရမ်၊ ကျား၊ မ နှင့် ပိုင်းခြားမှုအတွက် ပျမ်းမျှခုန်နှုန်းတိုးမှုကို ရှာဖွေရန် ယခု dplyr ကို ထပ်မံအသုံးပြုနိုင်သည်-

 library (dplyr)

#find mean jumping increase by program
df %>%
  group_by(program) %>%
  summarize(mean_height = mean(height))

# A tibble: 2 x 2
  program mean_height
           
1 1 5.2
2 2 3.3

#find mean jumping increase by gender
df %>%
  group_by(gender) %>%
  summarize(mean_height = mean(height))

# A tibble: 2 x 2
  gender mean_height
          
1 F 2.95
2M 5.55

#find mean jumping increase by division
df %>%
group_by(division) %>%
summarize(mean_height = mean(height))

# A tibble: 2 x 2
  division mean_height
            
1 1 4.95
2 2 3.55

ရလဒ်အနေဖြင့် အောက်ပါတို့ကို လေ့လာနိုင်ပါသည်။

  • လေ့ကျင့်ရေးပရိုဂရမ် 1 ( 5.2 လက်မ ) အသုံးပြုသော တစ်ဦးချင်းစီအတွက် ပျမ်းမျှ ခုန်နှုန်း မြင့်တက်လာမှုသည် လေ့ကျင့်ရေး ပရိုဂရမ် 2 (3.3 လက်မ ) အသုံးပြုသူများအတွက် ပျမ်းမျှ တိုးနှုန်းထက် ပိုများသည်။
  • အမျိုးသားများအတွက် ပျမ်းမျှ ခုန်အမြင့် ( 5.55လက်မ ) သည် အမျိုးသမီးများအတွက် ပျမ်းမျှတိုးနှုန်း (2.95လက်မ )ထက် ပိုများသည်။
  • Division 1 ကစားသမားများအကြား ပျမ်းမျှ ခုန်နှုန်း မြင့်တက်လာမှု ( ၄.၉၅ လက်မ ) သည် Division 2 ကစားသမားများအကြား ပျမ်းမျှ တိုးမြင့်မှု (၃.၅၅ လက်မ ) ထက် ပိုများသည်။

နိဂုံးချုပ်အနေနဲ့ပြောရမယ်ဆိုရင် လေ့ကျင့်ရေးအစီအစဉ်၊ ကျား၊မ ကွဲပြားမှုတွေဟာ ကစားသမားတွေရဲ့ ခုန်နှုန်းမြင့်လာမှုရဲ့ သိသာထင်ရှားတဲ့ အညွှန်းကိန်းတွေပါ။

ဤအချက်သုံးချက်ကြားတွင် သိသာထင်ရှားသော အပြန်အလှန်သက်ရောက်မှုများ မရှိဟုလည်း ကျွန်ုပ်တို့ပြောပါမည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါသင်ခန်းစာများသည် R တွင်အခြား ANOVA မော်ဒယ်များနှင့်အံဝင်ခွင်ကျဖြစ်ပုံကိုရှင်းပြသည်

တစ်လမ်းမောင်း ANOVA ကို R ဖြင့် မည်သို့လုပ်ဆောင်ရမည်နည်း။
R ဖြင့် နှစ်လမ်းသွား ANOVA ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်