R တွင် multivariate normality tests လုပ်နည်း
ကိန်းရှင်တစ်ခုတည်းကို ပုံမှန်ဖြန့်ဝေခြင်း ရှိ၊ မရှိ စမ်းသပ်လိုသည့်အခါ၊ ဖြန့်ဝေမှုကို မြင်သာစေရန် သို့မဟုတ် Anderson Darling စမ်းသပ်မှု သို့မဟုတ် Jarque-Bera စမ်းသပ်မှု ကဲ့သို့ တရားဝင် ကိန်းဂဏန်းစမ်းသပ်မှုကို လုပ်ဆောင်ရန် QQ ကွက်ကွက်ကို ဖန်တီးနိုင်သည်။
သို့သော်လည်း၊ များစွာသော variable များကို အုပ်စုတစ်ခုအဖြစ် ပုံမှန်ဖြန့်ဝေခြင်း ရှိ၊ မရှိ စမ်းသပ်လိုသောအခါ၊ ကျွန်ုပ်တို့သည် multivariate normality test ကို လုပ်ဆောင်ရန် လိုအပ်ပါသည်။
ဤကျူတိုရီရယ်တွင် R တွင် ပေးထားသည့် ဒေတာအစုံအတွက် အောက်ပါ multivariate normality tests များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။
- Mardia ၏စမ်းသပ်မှု
- စွမ်းအင်စမ်းသပ်မှု
- Multivariate kurtosis နှင့် skewness စမ်းသပ်မှုများ
ဆက်စပ်- ကျွန်ုပ်တို့သည် အမျိုးမျိုးကွဲပြားသော အကြောင်းအရာတစ်ခုတွင် အစွန်းများကို ခွဲခြားသတ်မှတ်လိုပါက၊ ကျွန်ုပ်တို့သည် Mahalanobis အကွာအဝေးကို အသုံးပြုနိုင်သည်။
ဥပမာ- R in Mardia စာမေးပွဲ
Mardia စမ်းသပ်မှုတွင် ကိန်းရှင်အုပ်စုတစ်စုသည် ပုံမှန်ဖြန့်ဝေမှု အများအပြားကို လိုက်နာခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်သည်။ စမ်းသပ်မှု၏ null နှင့် အခြားအခြားသော ယူဆချက်များမှာ အောက်ပါအတိုင်းဖြစ်သည် ။
H 0 (null) : ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သည်။
H a (အခြားရွေးချယ်စရာ)- ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုကို မလိုက်နာပါ ။
အောက်ပါကုဒ်သည် QuantPsyc ပက်ကေ့ဂျ်ကို အသုံးပြု၍ R တွင် ဤစမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-
library (QuantPsyc) #create dataset set.seed(0) data <- data.frame(x1 = rnorm(50), x2 = rnorm(50), x3 = rnorm(50)) #perform Multivariate normality test mult.norm(data)$ mult.test Beta-hat kappa p-val Skewness 1.630474 13.5872843 0.1926626 Kurtosis 13.895364 -0.7130395 0.4758213
dataset ၏ skewness နှင့် kurtosis နှစ်မျိုးလုံးတွင် multivariate normality အတွက် mult.norm() function tests များ။ p-value နှစ်ခုလုံးသည် 0.05 ထက်မနည်းသောကြောင့်၊ test ၏ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။ ကျွန်ုပ်တို့၏ဒေတာအတွဲရှိ ကိန်းရှင်သုံးမျိုးသည် အမျိုးမျိုးကွဲပြားသော ဖြန့်ဝေမှုနောက်သို့ မလိုက်ကြောင်း ကျွန်ုပ်တို့တွင် အထောက်အထားမရှိပါ။
ဥပမာ- R တွင် စွမ်းအင်စမ်းသပ်မှု
စွမ်းအင် စမ်းသပ်မှု တစ်ခုသည် ကိန်းရှင်အုပ်စုတစ်စုသည် ပုံမှန်ဖြန့်ဝေမှုတစ်ခုနောက်သို့လိုက်ခြင်းရှိ၊ မရှိ ဆုံးဖြတ်ပေးသည့် အခြားကိန်းဂဏန်းစမ်းသပ်မှုတစ်ခုဖြစ်သည်။ စမ်းသပ်မှု၏ null နှင့် အခြားအခြားသော ယူဆချက်များမှာ အောက်ပါအတိုင်းဖြစ်သည် ။
H 0 (null) : ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သည်။
H a (အခြားရွေးချယ်စရာ)- ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုကို မလိုက်နာပါ ။
အောက်ပါကုဒ်သည် စွမ်းအင် အထုပ်ကို အသုံးပြု၍ ဤစမ်းသပ်မှုကို R တွင် မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-
library (energy) #create dataset set.seed(0) data <- data.frame(x1 = rnorm(50), x2 = rnorm(50), x3 = rnorm(50)) #perform Multivariate normality test mvnorm.etest(data, R= 100 ) Energy test of multivariate normality: estimated parameters data: x, sample size 50, dimension 3, replicates 100 E-statistic = 0.90923, p-value = 0.31
စာမေးပွဲ၏ p-တန်ဖိုးသည် 0.31 ဖြစ်သည်။ ဤကိန်းဂဏန်းသည် 0.05 ထက်မနည်းသောကြောင့်၊ စာမေးပွဲ၏ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။ ကျွန်ုပ်တို့၏ဒေတာအတွဲရှိ ကိန်းရှင်သုံးမျိုးသည် အမျိုးမျိုးကွဲပြားသော ဖြန့်ဖြူးမှုတစ်ခုအား မလိုက်နာကြောင်း ကျွန်ုပ်တို့တွင် အထောက်အထားမရှိပါ။
မှတ်ချက်။ သေးငယ်သောနမူနာအရွယ်အစားများပါသည့် ဒေတာအတွဲများအတွက်၊ စမ်းသပ်စာရင်းအင်းအား ပိုမိုယုံကြည်စိတ်ချရသော ခန့်မှန်းချက်တစ်ခုထုတ်လုပ်ရန် ဤနံပါတ်ကို တိုးမြှင့်နိုင်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် QQ ကွက်ကွက်တစ်ခုကို ဖန်တီးပြီး အဓိပ္ပာယ်ဖွင့်နည်း
R တွင် Anderson-Darling စမ်းသပ်မှုပြုလုပ်နည်း
R တွင် Jarque-Bera စမ်းသပ်မှုပြုလုပ်နည်း
R တွင် Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်နည်း