Python တွင် shapiro-wilk test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။

အားဖြင့် Benjamin Anderson ဇူလိုင် 28, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Shapiro-Wilk စစ်ဆေးမှု သည် ပုံမှန်အခြေအနေ၏ စမ်းသပ်မှုဖြစ်သည်။ နမူနာကို ပုံမှန်ဖြန့်ဖြူးမှု မှ လာသလား မဆုံးဖြတ်ရန် ၎င်းကို အသုံးပြုသည်။

Python တွင် Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်ရန် အောက်ပါ syntax ကိုအသုံးပြုသည့် scipy.stats.shapiro() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

scipy.stats.shapiro(x)

ရွှေ-

x- နမူနာဒေတာဇယား။

ဤလုပ်ဆောင်ချက်သည် စမ်းသပ်မှုစာရင်းအင်းနှင့် သက်ဆိုင်ရာ p-တန်ဖိုးကို ပြန်ပေးသည်။

p-value သည် အချို့သော အရေးပါမှုအဆင့်အောက်တွင် ရှိနေပါက၊ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်မဟုတ်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။

ဤသင်ခန်းစာတွင် ဤအင်္ဂါရပ်ကို လက်တွေ့အသုံးချနည်းအချို့ကို ဥပမာပြထားသည်။

ဥပမာ 1- ပုံမှန်ဖြန့်ဝေထားသောဒေတာအတွက် Shapiro-Wilk စမ်းသပ်မှု

ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာရှိသည်ဆိုပါစို့။

 from numpy.random import seed
from numpy.random import randn

#set seed (eg make this example reproducible)
seed(0)

#generate dataset of 100 random values that follow a standard normal distribution
data = randn(100)

အောက်ပါကုဒ်သည် ပုံမှန်ဖြန့်ဝေမှုမှ ဆင်းသက်ခြင်းရှိမရှိ ဆုံးဖြတ်ရန် ဤဒေတာတန်ဖိုး 100 ၏ နမူနာတွင် Shapiro-Wilk စမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-

 from scipy.stats import shapiro

#perform Shapiro-Wilk test
shapiro(data)

ShapiroResult(statistic=0.9926937818527222, pvalue=0.8689165711402893)

ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.9927 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.8689 ဖြစ်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထား မရှိပါ။

ကျွန်ုပ်တို့သည် စံပုံမှန်ဖြန့်ဝေမှုနှင့်အညီ ကျပန်းတန်ဖိုးများကိုထုတ်ပေးသည့် randn() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ နမူနာဒေတာကို ထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဖြစ်သင့်ပါ။

ဥပမာ 2- ပုံမှန်မဟုတ်သော ဖြန့်ဝေသည့်ဒေတာအတွက် Shapiro-Wilk စမ်းသပ်မှု

ယခု ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာရှိသည်ဆိုပါစို့။

 from numpy.random import seed
from numpy.random import fish

#set seed (eg make this example reproducible)
seed(0)

#generate dataset of 100 values that follows a Poisson distribution with mean=5
data = fish(5, 100)

 from scipy.stats import shapiro

#perform Shapiro-Wilk test
shapiro(data)

ShapiroResult(statistic=0.9581913948059082, pvalue=0.002994443289935589)

ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.9582 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.00299 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။

Poisson ဖြန့်ဝေမှု နောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုးများကိုထုတ်ပေးသည့် Poisson() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ နမူနာဒေတာကိုထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဟုတ်ပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် စာရင်းအင်းဆော့ဖ်ဝဲအမျိုးမျိုးတွင် အခြားသော ပုံမှန်စစ်ဆေးမှုများကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် Shapiro-Wilk စမ်းသပ်မှုပြုလုပ်နည်း
Python တွင် Anderson-Darling Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
Python တွင် Kolmogorov-Smirnov စမ်းသပ်မှုပြုလုပ်နည်း

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ 1- ပုံမှန်ဖြန့်ဝေထားသောဒေတာအတွက် Shapiro-Wilk စမ်းသပ်မှု

ဥပမာ 2- ပုံမှန်မဟုတ်သော ဖြန့်ဝေသည့်ဒေတာအတွက် Shapiro-Wilk စမ်းသပ်မှု

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။