Bartlett's test of sphericity လမ်းညွှန်
Bartlett ၏ လုံးပတ်ဆိုင်ရာ စမ်းသပ်မှု သည် လေ့လာတွေ့ရှိထားသော ဆက်စပ်မက်ထရစ်ကို အထောက်အထား မက်ထရစ်နှင့် နှိုင်းယှဉ်သည်။ အခြေခံအားဖြင့်၊ ၎င်းသည် အချက်များစွာဖြင့် အကျဉ်းချုံးနိုင်သည့် variable များကြားတွင် အချို့သော redundancy ရှိမရှိ စစ်ဆေးပါသည်။
စမ်းသပ်မှု၏ null hypothesis မှာ ကိန်းရှင်များသည် ဆက်စပ်မှုမရှိသော၊ ဆိုလိုသည်မှာ orthogonal ဖြစ်သည်။ အစားထိုးယူဆချက်မှာ ကိန်းရှင်များသည် ပုံသဏ္ဍာန်မဟုတ်ကြောင်း ဆိုလိုသည်မှာ ၎င်းတို့သည် ဆက်နွယ်မှုမက်ထရစ်အား အမှတ်အသားပြုမက်ထရစ်နှင့် သိသိသာသာကွဲပြားသည့်အချက်နှင့် လုံလောက်စွာဆက်စပ်နေပါသည်။
ဒေတာလျှော့ချရေးနည်းပညာသည် ဒေတာကို အမှန်တကယ် အဓိပ္ပါယ်ရှိရှိ ချုံ့နိုင်ကြောင်း အတည်ပြုရန် အဓိကအစိတ်အပိုင်းခွဲခြမ်းစိတ်ဖြာခြင်း သို့မဟုတ် အကြောင်းရင်းခွဲခြမ်းစိတ်ဖြာခြင်းကဲ့သို့သော ဒေတာလျှော့ချရေးနည်းစနစ်ကို အသုံးမပြုမီ ဤစစ်ဆေးမှုကို မကြာခဏပြုလုပ်ပါသည်။
မှတ်ချက်- Bartlett ၏ လုံးပတ်ဆိုင်ရာ စမ်းသပ်မှုသည် Bartlett ၏ ကွဲပြားမှုများ၏ တန်းတူညီမျှမှုအတွက် စမ်းသပ်မှု နှင့် မတူပါ။ ၎င်းတို့နှစ်ဦးသည် အလားတူအမည်များ ရှိသောကြောင့် မကြာခဏ ရှုပ်ထွေးမှုတစ်ခုဖြစ်သည်။
ဆက်စပ်မက်ထရစ်နှင့် အမှတ်အသားပြုမက်ထရစ်
ဆက်စပ်မက်ထရစ် ဆိုသည်မှာ ကိန်းရှင်များကြားရှိ ဆက်စပ်ကိန်းများကို ပြသသော တန်ဖိုးများ၏ matrix တစ်ခုဖြစ်သည်။ ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဆက်စပ်မက်ထရစ်သည် ပရော်ဖက်ရှင်နယ်ဘတ်စကတ်ဘောအသင်းများအတွက် မတူညီသောကိန်းရှင်များကြားရှိ ဆက်စပ်ကိန်းများကို ပြသသည်။
ဆက်စပ်မှုကိန်းဂဏန်းများ သည် -1 မှ 1 အထိ ကွဲပြားနိုင်သည်။ နောက်ထပ်တန်ဖိုးတစ်ခုသည် 0 မှဖြစ်ပြီး၊ ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုပိုများလေဖြစ်သည်။
Identity matrix သည် matrix တစ်ခုဖြစ်ပြီး ထောင့်ဖြတ်ပေါ်ရှိ တန်ဖိုးများအားလုံးသည် 1 ဖြစ်ပြီး အခြားတန်ဖိုးများအားလုံးသည် 0 ဖြစ်သည်။
ဤအခြေအနေတွင်၊ ဤ matrix ရှိ ဂဏန်းများသည် ဆက်စပ်ကိန်းကို ကိုယ်စားပြုပါက၊ ကိန်းရှင်တစ်ခုစီသည် အခြားသော variable များအားလုံးနှင့် လုံးဝဆက်စပ်နေသည် (ဆိုလိုသည်မှာ “ ဆက်နွယ်မှုမရှိသော” ) ဖြစ်သောကြောင့် PCA သို့မဟုတ် factor analysis ကဲ့သို့သော data reduction technique သည် “ မရနိုင်ပါ။ ဒေတာကို အဓိပ္ပါယ်ရှိသောနည်းဖြင့် ချုံ့ပါ။
ထို့ကြောင့်၊ ကျွန်ုပ်တို့ Bartlett ၏ လုံးပတ်စမ်းသပ်မှုကို လုပ်ဆောင်ရခြင်း အကြောင်းရင်းမှာ ကျွန်ုပ်တို့၏ဒေတာအတွဲရှိ variable များ၏ ဆက်စပ်မက်ထရစ်သည် ဝိသေသလက္ခဏာမက်ထရစ်နှင့် သိသိသာသာကွဲလွဲနေကြောင်း သေချာစေရန်၊ လျှော့ချရေးနည်းပညာဒေတာကို အသုံးပြုရန် သင့်လျော်ကြောင်း သေချာစေရန်ဖြစ်သည်။
Bartlett’s test of sphericity ၏ p-value သည် ရွေးချယ်ထားသော အရေးပါမှုအဆင့်ထက် နည်းနေပါက (အများအားဖြင့် ရွေးချယ်မှုများမှာ 0.10၊ 0.05 နှင့် 0.01) ဆိုလျှင် ကျွန်ုပ်တို့၏ dataset သည် data reduction technique အတွက် သင့်လျော်ပါသည်။
R တွင် Bartlett ၏ စက်လုံးပုံစမ်းသပ်နည်း
R တွင် Bartlett ၏ လုံးပတ်စမ်းသပ်မှုကို လုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် စိတ်ပညာ စာကြည့်တိုက်မှ cortest.bartlett() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်၏ ယေဘူယျ syntax မှာ အောက်ပါအတိုင်းဖြစ်သည် ။
cortest.bartlett(R၊ n)
- R- ဒေတာအတွဲ၏ ဆက်စပ်မက်ထရစ်
- n- ဒေတာအတွဲ၏ နမူနာအရွယ်အစား
အောက်ပါကုဒ်သည် ကျွန်ုပ်တို့ဖန်တီးထားသော ဒေတာအတွဲအတုတစ်ခုတွင် ဤစမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို သရုပ်ပြသည်-
#make this example reproducible set.seed(0) #create fake data data <- data.frame(A = rnorm(50, 1, 4), B = rnorm(50, 3, 6), C = rnorm(50, 5, 8)) #view first six rows of data head(data) #ABC #1 6.0518171 4.5968242 11.25487348 #2 -0.3049334 0.7397837 -1.21421297 #3 6.3191971 17.6481878 0.07208074 #4 6.0897173 -1.7720347 5.37264242 #5 2.6585657 2.6707352 -4.04308622 #6 -5.1598002 4.5008479 9.61375026 #find correlation matrix of data cor_matrix <- cor(data) #view correlation matrix cor_matrix #ABC #A 1.0000000 0.1600155667 0.2825308511 #B 0.1600156 1.0000000000 0.0005358384 #C 0.2825309 0.0005358384 1.0000000000 #load psych library library(psych) #perform Bartlett's Test of Sphericity cortest.bartlett(cor_matrix, n = nrow(data)) #$chisq #[1] 5.252329 # #$p.value #[1] 0.1542258 # #$df #[1] 3
Chi-square စမ်းသပ်မှု ကိန်းဂဏန်းသည် 5.252329 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.1542258 ဖြစ်ပြီး ကျွန်ုပ်တို့၏ အရေးပါမှုအဆင့်ထက် မနည်းပါ (0.05 ကိုသုံးကြပါစို့)။ ထို့ကြောင့် ဤဒေတာများသည် PCA သို့မဟုတ် Factor ခွဲခြမ်းစိတ်ဖြာခြင်းအတွက် မသင့်လျော်ပေ။
ဒါကို ရိုးရိုးရှင်းရှင်း ပြောရရင်၊ ကျွန်ုပ်တို့ရဲ့ dataset မှာရှိတဲ့ variable သုံးခုဟာ လုံလောက်တဲ့ ဆက်စပ်မှုမရှိတဲ့အတွက် PCA ဒါမှမဟုတ် factor analysis လိုမျိုး data reduction technique က data မှာ ရှိနေတဲ့ သိသာထင်ရှားတဲ့ varianance ကို linear ပေါင်းစပ်မှုတွေအဖြစ် ချုံ့ဖို့ အခက်အခဲရှိပါလိမ့်မယ်။