Python တွင် multivariate normality tests ပြုလုပ်နည်း
ကိန်းရှင်တစ်ခုအား ပုံမှန်ဖြန့်ဝေခြင်း ရှိ၊ မရှိ စမ်းသပ်လိုသောအခါ၊ ကျွန်ုပ်တို့ ဖန်တီးနိုင်သည်။ QQ သည် ဖြန့်ဖြူးမှုကို မြင်သာစေရန် ကြံစည်ခြင်း သို့မဟုတ် Anderson Darling စမ်းသပ်မှု သို့မဟုတ် Jarque-Bera စမ်းသပ်မှု ကဲ့သို့ တရားဝင် ကိန်းဂဏန်းစမ်းသပ်မှုတစ်ခု လုပ်ဆောင်နိုင်သည် ။
သို့သော်လည်း၊ များစွာသော variable များကို အုပ်စုတစ်ခုအဖြစ် ပုံမှန်ဖြန့်ဝေခြင်း ရှိ၊ မရှိ စမ်းသပ်လိုသောအခါ၊ ကျွန်ုပ်တို့သည် multivariate normality test ကို လုပ်ဆောင်ရန် လိုအပ်ပါသည်။
ဤသင်ခန်းစာတွင် Python တွင်ပေးထားသည့်ဒေတာအတွဲအတွက် Henze-Zirkler multivariate normality test ကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။
ဆက်စပ်- ကျွန်ုပ်တို့သည် အမျိုးမျိုးကွဲပြားသော အကြောင်းအရာတစ်ခုတွင် အစွန်းများကို ခွဲခြားသတ်မှတ်လိုပါက၊ ကျွန်ုပ်တို့သည် Mahalanobis အကွာအဝေးကို အသုံးပြုနိုင်သည် ။
ဥပမာ- Python တွင် Henze-Zirkler multivariate normality စမ်းသပ်မှု
Henze-Zirkler multivariate normality test သည် variable အုပ်စုတစ်စုသည် multivariate normal distribution ကို လိုက်နာခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်သည်။ စမ်းသပ်မှု၏ null နှင့် အခြားအခြားသော ယူဆချက်များမှာ အောက်ပါအတိုင်းဖြစ်သည် ။
H 0 (null) : ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သည်။
H a (အခြားရွေးချယ်စရာ)- ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုကို မလိုက်နာပါ ။
Python တွင် ဤစမ်းသပ်မှုကို လုပ်ဆောင်ရန် ကျွန်ုပ်တို့သည် ပင်ဂွင်းစာကြည့်တိုက်မှ multivariate_normality() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
ပထမဦးစွာ ကျွန်ုပ်တို့သည် ပင်ဂွင်းကို ထည့်သွင်းရန် လိုအပ်ပါသည်။
pip install penguin
ထို့နောက်၊ ကျွန်ုပ်တို့သည် multivariate_normality() လုပ်ဆောင်ချက်ကို တင်သွင်းနိုင်ပြီး ပေးထားသည့် ဒေတာအစုံအတွက် multivariate normality test ကို လုပ်ဆောင်ရန် ၎င်းကို အသုံးပြုနိုင်ပါသည်။
#import necessary packages from penguin import multivariate_normality import pandas as pd import numpy as np #create a dataset with three variables x1, x2, and x3 df = pd.DataFrame({'x1':np.random.normal(size= 50 ), 'x2': np.random.normal(size= 50 ), 'x3': np.random.normal(size= 50 )}) #perform the Henze-Zirkler Multivariate Normality Test multivariate_normality(df, alpha= .05 ) HZResults(hz=0.5956866563391165, pval=0.6461804077893423, normal=True)
စာမေးပွဲရလဒ်များမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- စမ်းသပ်ကိန်းဂဏန်း Hz: 0.59569
- p-တန်ဖိုး- 0.64618
စစ်ဆေးမှု၏ p-value သည် ကျွန်ုပ်တို့သတ်မှတ်ထားသော alpha တန်ဖိုး 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။ ဒေတာအတွဲသည် မျိုးစုံကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လိုက်ရန်ဟု ယူဆနိုင်သည်။
ဆက်စပ်- ဤသုတေသနစာတမ်းတွင် Henze-Zirkler စမ်းသပ်မှုကို လက်တွေ့ကမ္ဘာဆေးဘက်ဆိုင်ရာအသုံးချပရိုဂရမ်များတွင် မည်သို့အသုံးပြုသည်ကို လေ့လာပါ။