Python တွင် shapiro-wilk test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
Shapiro-Wilk စစ်ဆေးမှု သည် ပုံမှန်အခြေအနေ၏ စမ်းသပ်မှုဖြစ်သည်။ နမူနာကို ပုံမှန်ဖြန့်ဖြူးမှု မှ လာသလား မဆုံးဖြတ်ရန် ၎င်းကို အသုံးပြုသည်။
Python တွင် Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်ရန် အောက်ပါ syntax ကိုအသုံးပြုသည့် scipy.stats.shapiro() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
scipy.stats.shapiro(x)
ရွှေ-
- x- နမူနာဒေတာဇယား။
ဤလုပ်ဆောင်ချက်သည် စမ်းသပ်မှုစာရင်းအင်းနှင့် သက်ဆိုင်ရာ p-တန်ဖိုးကို ပြန်ပေးသည်။
p-value သည် အချို့သော အရေးပါမှုအဆင့်အောက်တွင် ရှိနေပါက၊ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်မဟုတ်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။
ဤသင်ခန်းစာတွင် ဤအင်္ဂါရပ်ကို လက်တွေ့အသုံးချနည်းအချို့ကို ဥပမာပြထားသည်။
ဥပမာ 1- ပုံမှန်ဖြန့်ဝေထားသောဒေတာအတွက် Shapiro-Wilk စမ်းသပ်မှု
ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာရှိသည်ဆိုပါစို့။
from numpy.random import seed from numpy.random import randn #set seed (eg make this example reproducible) seed(0) #generate dataset of 100 random values that follow a standard normal distribution data = randn(100)
အောက်ပါကုဒ်သည် ပုံမှန်ဖြန့်ဝေမှုမှ ဆင်းသက်ခြင်းရှိမရှိ ဆုံးဖြတ်ရန် ဤဒေတာတန်ဖိုး 100 ၏ နမူနာတွင် Shapiro-Wilk စမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-
from scipy.stats import shapiro #perform Shapiro-Wilk test shapiro(data) ShapiroResult(statistic=0.9926937818527222, pvalue=0.8689165711402893)
ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.9927 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.8689 ဖြစ်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထား မရှိပါ။
ကျွန်ုပ်တို့သည် စံပုံမှန်ဖြန့်ဝေမှုနှင့်အညီ ကျပန်းတန်ဖိုးများကိုထုတ်ပေးသည့် randn() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ နမူနာဒေတာကို ထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဖြစ်သင့်ပါ။
ဥပမာ 2- ပုံမှန်မဟုတ်သော ဖြန့်ဝေသည့်ဒေတာအတွက် Shapiro-Wilk စမ်းသပ်မှု
ယခု ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာရှိသည်ဆိုပါစို့။
from numpy.random import seed from numpy.random import fish #set seed (eg make this example reproducible) seed(0) #generate dataset of 100 values that follows a Poisson distribution with mean=5 data = fish(5, 100)
အောက်ပါကုဒ်သည် ပုံမှန်ဖြန့်ဝေမှုမှ ဆင်းသက်ခြင်းရှိမရှိ ဆုံးဖြတ်ရန် ဤဒေတာတန်ဖိုး 100 ၏ နမူနာတွင် Shapiro-Wilk စမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-
from scipy.stats import shapiro #perform Shapiro-Wilk test shapiro(data) ShapiroResult(statistic=0.9581913948059082, pvalue=0.002994443289935589)
ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.9582 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.00299 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။
Poisson ဖြန့်ဝေမှု နောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုးများကိုထုတ်ပေးသည့် Poisson() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ နမူနာဒေတာကိုထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဟုတ်ပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် စာရင်းအင်းဆော့ဖ်ဝဲအမျိုးမျိုးတွင် အခြားသော ပုံမှန်စစ်ဆေးမှုများကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်နည်း
Python တွင် Anderson-Darling Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
Python တွင် Kolmogorov-Smirnov စမ်းသပ်မှုပြုလုပ်နည်း