Python တွင် multivariate normality tests ပြုလုပ်နည်း


ကိန်းရှင်တစ်ခုအား ပုံမှန်ဖြန့်ဝေခြင်း ရှိ၊ မရှိ စမ်းသပ်လိုသောအခါ၊ ကျွန်ုပ်တို့ ဖန်တီးနိုင်သည်။   QQ သည် ဖြန့်ဖြူးမှုကို မြင်သာစေရန် ကြံစည်ခြင်း သို့မဟုတ် Anderson Darling စမ်းသပ်မှု သို့မဟုတ် Jarque-Bera စမ်းသပ်မှု ကဲ့သို့ တရားဝင် ကိန်းဂဏန်းစမ်းသပ်မှုတစ်ခု လုပ်ဆောင်နိုင်သည်

သို့သော်လည်း၊ များစွာသော variable များကို အုပ်စုတစ်ခုအဖြစ် ပုံမှန်ဖြန့်ဝေခြင်း ရှိ၊ မရှိ စမ်းသပ်လိုသောအခါ၊ ကျွန်ုပ်တို့သည် multivariate normality test ကို လုပ်ဆောင်ရန် လိုအပ်ပါသည်။

ဤသင်ခန်းစာတွင် Python တွင်ပေးထားသည့်ဒေတာအတွဲအတွက် Henze-Zirkler multivariate normality test ကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။

ဆက်စပ်- ကျွန်ုပ်တို့သည် အမျိုးမျိုးကွဲပြားသော အကြောင်းအရာတစ်ခုတွင် အစွန်းများကို ခွဲခြားသတ်မှတ်လိုပါက၊ ကျွန်ုပ်တို့သည် Mahalanobis အကွာအဝေးကို အသုံးပြုနိုင်သည်

ဥပမာ- Python တွင် Henze-Zirkler multivariate normality စမ်းသပ်မှု

Henze-Zirkler multivariate normality test သည် variable အုပ်စုတစ်စုသည် multivariate normal distribution ကို လိုက်နာခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်သည်။ စမ်းသပ်မှု၏ null နှင့် အခြားအခြားသော ယူဆချက်များမှာ အောက်ပါအတိုင်းဖြစ်သည် ။

H 0 (null) : ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သည်။

H a (အခြားရွေးချယ်စရာ)- ကိန်းရှင်များသည် အမျိုးမျိုးကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုကို မလိုက်နာပါ

Python တွင် ဤစမ်းသပ်မှုကို လုပ်ဆောင်ရန် ကျွန်ုပ်တို့သည် ပင်ဂွင်းစာကြည့်တိုက်မှ multivariate_normality() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

ပထမဦးစွာ ကျွန်ုပ်တို့သည် ပင်ဂွင်းကို ထည့်သွင်းရန် လိုအပ်ပါသည်။

 pip install penguin

ထို့နောက်၊ ကျွန်ုပ်တို့သည် multivariate_normality() လုပ်ဆောင်ချက်ကို တင်သွင်းနိုင်ပြီး ပေးထားသည့် ဒေတာအစုံအတွက် multivariate normality test ကို လုပ်ဆောင်ရန် ၎င်းကို အသုံးပြုနိုင်ပါသည်။

 #import necessary packages
from penguin import multivariate_normality
import pandas as pd
import numpy as np

#create a dataset with three variables x1, x2, and x3
df = pd.DataFrame({'x1':np.random.normal(size= 50 ),
                   'x2': np.random.normal(size= 50 ),
                   'x3': np.random.normal(size= 50 )})

#perform the Henze-Zirkler Multivariate Normality Test
multivariate_normality(df, alpha= .05 )

HZResults(hz=0.5956866563391165, pval=0.6461804077893423, normal=True)

စာမေးပွဲရလဒ်များမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • စမ်းသပ်ကိန်းဂဏန်း Hz: 0.59569
  • p-တန်ဖိုး- 0.64618

စစ်ဆေးမှု၏ p-value သည် ကျွန်ုပ်တို့သတ်မှတ်ထားသော alpha တန်ဖိုး 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။ ဒေတာအတွဲသည် မျိုးစုံကွဲပြားသော ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လိုက်ရန်ဟု ယူဆနိုင်သည်။

ဆက်စပ်- ဤသုတေသနစာတမ်းတွင် Henze-Zirkler စမ်းသပ်မှုကို လက်တွေ့ကမ္ဘာဆေးဘက်ဆိုင်ရာအသုံးချပရိုဂရမ်များတွင် မည်သို့အသုံးပြုသည်ကို လေ့လာပါ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်