Bartlett's test of sphericity လမ်းညွှန်


Bartlett ၏ လုံးပတ်ဆိုင်ရာ စမ်းသပ်မှု သည် လေ့လာတွေ့ရှိထားသော ဆက်စပ်မက်ထရစ်ကို အထောက်အထား မက်ထရစ်နှင့် နှိုင်းယှဉ်သည်။ အခြေခံအားဖြင့်၊ ၎င်းသည် အချက်များစွာဖြင့် အကျဉ်းချုံးနိုင်သည့် variable များကြားတွင် အချို့သော redundancy ရှိမရှိ စစ်ဆေးပါသည်။

စမ်းသပ်မှု၏ null hypothesis မှာ ကိန်းရှင်များသည် ဆက်စပ်မှုမရှိသော၊ ဆိုလိုသည်မှာ orthogonal ဖြစ်သည်။ အစားထိုးယူဆချက်မှာ ကိန်းရှင်များသည် ပုံသဏ္ဍာန်မဟုတ်ကြောင်း ဆိုလိုသည်မှာ ၎င်းတို့သည် ဆက်နွယ်မှုမက်ထရစ်အား အမှတ်အသားပြုမက်ထရစ်နှင့် သိသိသာသာကွဲပြားသည့်အချက်နှင့် လုံလောက်စွာဆက်စပ်နေပါသည်။

ဒေတာလျှော့ချရေးနည်းပညာသည် ဒေတာကို အမှန်တကယ် အဓိပ္ပါယ်ရှိရှိ ချုံ့နိုင်ကြောင်း အတည်ပြုရန် အဓိကအစိတ်အပိုင်းခွဲခြမ်းစိတ်ဖြာခြင်း သို့မဟုတ် အကြောင်းရင်းခွဲခြမ်းစိတ်ဖြာခြင်းကဲ့သို့သော ဒေတာလျှော့ချရေးနည်းစနစ်ကို အသုံးမပြုမီ ဤစစ်ဆေးမှုကို မကြာခဏပြုလုပ်ပါသည်။

မှတ်ချက်- Bartlett ၏ လုံးပတ်ဆိုင်ရာ စမ်းသပ်မှုသည် Bartlett ၏ ကွဲပြားမှုများ၏ တန်းတူညီမျှမှုအတွက် စမ်းသပ်မှု နှင့် မတူပါ။ ၎င်းတို့နှစ်ဦးသည် အလားတူအမည်များ ရှိသောကြောင့် မကြာခဏ ရှုပ်ထွေးမှုတစ်ခုဖြစ်သည်။

ဆက်စပ်မက်ထရစ်နှင့် အမှတ်အသားပြုမက်ထရစ်

ဆက်စပ်မက်ထရစ် ဆိုသည်မှာ ကိန်းရှင်များကြားရှိ ဆက်စပ်ကိန်းများကို ပြသသော တန်ဖိုးများ၏ matrix တစ်ခုဖြစ်သည်။ ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဆက်စပ်မက်ထရစ်သည် ပရော်ဖက်ရှင်နယ်ဘတ်စကတ်ဘောအသင်းများအတွက် မတူညီသောကိန်းရှင်များကြားရှိ ဆက်စပ်ကိန်းများကို ပြသသည်။

ဆက်စပ်မှုကိန်းဂဏန်းများ သည် -1 မှ 1 အထိ ကွဲပြားနိုင်သည်။ နောက်ထပ်တန်ဖိုးတစ်ခုသည် 0 မှဖြစ်ပြီး၊ ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုပိုများလေဖြစ်သည်။

Identity matrix သည် matrix တစ်ခုဖြစ်ပြီး ထောင့်ဖြတ်ပေါ်ရှိ တန်ဖိုးများအားလုံးသည် 1 ဖြစ်ပြီး အခြားတန်ဖိုးများအားလုံးသည် 0 ဖြစ်သည်။

ဤအခြေအနေတွင်၊ ဤ matrix ရှိ ဂဏန်းများသည် ဆက်စပ်ကိန်းကို ကိုယ်စားပြုပါက၊ ကိန်းရှင်တစ်ခုစီသည် အခြားသော variable များအားလုံးနှင့် လုံးဝဆက်စပ်နေသည် (ဆိုလိုသည်မှာ “ ဆက်နွယ်မှုမရှိသော” ) ဖြစ်သောကြောင့် PCA သို့မဟုတ် factor analysis ကဲ့သို့သော data reduction technique သည် “ မရနိုင်ပါ။ ဒေတာကို အဓိပ္ပါယ်ရှိသောနည်းဖြင့် ချုံ့ပါ။

ထို့ကြောင့်၊ ကျွန်ုပ်တို့ Bartlett ၏ လုံးပတ်စမ်းသပ်မှုကို လုပ်ဆောင်ရခြင်း အကြောင်းရင်းမှာ ကျွန်ုပ်တို့၏ဒေတာအတွဲရှိ variable များ၏ ဆက်စပ်မက်ထရစ်သည် ဝိသေသလက္ခဏာမက်ထရစ်နှင့် သိသိသာသာကွဲလွဲနေကြောင်း သေချာစေရန်၊ လျှော့ချရေးနည်းပညာဒေတာကို အသုံးပြုရန် သင့်လျော်ကြောင်း သေချာစေရန်ဖြစ်သည်။

Bartlett’s test of sphericity ၏ p-value သည် ရွေးချယ်ထားသော အရေးပါမှုအဆင့်ထက် နည်းနေပါက (အများအားဖြင့် ရွေးချယ်မှုများမှာ 0.10၊ 0.05 နှင့် 0.01) ဆိုလျှင် ကျွန်ုပ်တို့၏ dataset သည် data reduction technique အတွက် သင့်လျော်ပါသည်။

R တွင် Bartlett ၏ စက်လုံးပုံစမ်းသပ်နည်း

R တွင် Bartlett ၏ လုံးပတ်စမ်းသပ်မှုကို လုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် စိတ်ပညာ စာကြည့်တိုက်မှ cortest.bartlett() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်၏ ယေဘူယျ syntax မှာ အောက်ပါအတိုင်းဖြစ်သည် ။

cortest.bartlett(R၊ n)

  • R- ဒေတာအတွဲ၏ ဆက်စပ်မက်ထရစ်
  • n- ဒေတာအတွဲ၏ နမူနာအရွယ်အစား

အောက်ပါကုဒ်သည် ကျွန်ုပ်တို့ဖန်တီးထားသော ဒေတာအတွဲအတုတစ်ခုတွင် ဤစမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို သရုပ်ပြသည်-

 #make this example reproducible
set.seed(0)

#create fake data
data <- data.frame(A = rnorm(50, 1, 4), B = rnorm(50, 3, 6), C = rnorm(50, 5, 8))

#view first six rows of data
head(data)
#ABC
#1 6.0518171 4.5968242 11.25487348
#2 -0.3049334 0.7397837 -1.21421297
#3 6.3191971 17.6481878 0.07208074
#4 6.0897173 -1.7720347 5.37264242
#5 2.6585657 2.6707352 -4.04308622
#6 -5.1598002 4.5008479 9.61375026

#find correlation matrix of data
cor_matrix <- cor(data)

#view correlation matrix
cor_matrix

#ABC
#A 1.0000000 0.1600155667 0.2825308511
#B 0.1600156 1.0000000000 0.0005358384
#C 0.2825309 0.0005358384 1.0000000000

#load psych library
library(psych)

#perform Bartlett's Test of Sphericity
cortest.bartlett(cor_matrix, n = nrow(data))

#$chisq
#[1] 5.252329
#
#$p.value
#[1] 0.1542258
#
#$df
#[1] 3

Chi-square စမ်းသပ်မှု ကိန်းဂဏန်းသည် 5.252329 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.1542258 ဖြစ်ပြီး ကျွန်ုပ်တို့၏ အရေးပါမှုအဆင့်ထက် မနည်းပါ (0.05 ကိုသုံးကြပါစို့)။ ထို့ကြောင့် ဤဒေတာများသည် PCA သို့မဟုတ် Factor ခွဲခြမ်းစိတ်ဖြာခြင်းအတွက် မသင့်လျော်ပေ။

ဒါကို ရိုးရိုးရှင်းရှင်း ပြောရရင်၊ ကျွန်ုပ်တို့ရဲ့ dataset မှာရှိတဲ့ variable သုံးခုဟာ လုံလောက်တဲ့ ဆက်စပ်မှုမရှိတဲ့အတွက် PCA ဒါမှမဟုတ် factor analysis လိုမျိုး data reduction technique က data မှာ ရှိနေတဲ့ သိသာထင်ရှားတဲ့ varianance ကို linear ပေါင်းစပ်မှုတွေအဖြစ် ချုံ့ဖို့ အခက်အခဲရှိပါလိမ့်မယ်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်