Python တွင် kolmogorov-smirnov စမ်းသပ်မှုပြုလုပ်နည်း
Kolmogorov-Smirnov စမ်းသပ်မှုကို နမူနာတစ်ခုသည် ဖြန့်ဖြူးမှုတစ်ခုမှ ထွက်ပေါ်လာခြင်း ရှိ၊ မရှိ စမ်းသပ်ရန် အသုံးပြုသည်။
Python တွင် Kolmogorov-Smirnov စမ်းသပ်မှုပြုလုပ်ရန်၊ နမူနာနှစ်ခုစမ်းသပ်မှုတစ်ခုအတွက် scipy.stats.kstest() သို့မဟုတ် scipy.stats.ks_2samp() ကို အသုံးပြုနိုင်ပါသည်။
ဤသင်ခန်းစာတွင် လုပ်ဆောင်ချက်တစ်ခုစီကို လက်တွေ့အသုံးချနည်းကို နမူနာပြထားသည်။
ဥပမာ 1- Kolmogorov-Smirnov စမ်းသပ်မှုနမူနာ
ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာရှိသည်ဆိုပါစို့။
from numpy.random import seed from numpy.random import fish #set seed (eg make this example reproducible) seed(0) #generate dataset of 100 values that follows a Poisson distribution with mean=5 data = fish(5, 100)
အောက်ပါကုဒ်သည် ပုံမှန်ဖြန့်ဝေမှုမှ ဆင်းသက်ခြင်းရှိမရှိ ဆုံးဖြတ်ရန် ဤဒေတာတန်ဖိုး 100 ၏ နမူနာတွင် Kolmogorov-Smirnov စမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-
from scipy.stats import kstest #perform Kolmogorov-Smirnov test kstest(data, ' norm ') KstestResult(statistic=0.9072498680518208, pvalue=1.0908062873170218e-103)
ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.9072 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 1.0908e-103 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။
Poisson ဖြန့်ဝေမှု နောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုးများကိုထုတ်ပေးသည့် Poisson() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ နမူနာဒေတာကိုထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဟုတ်ပါ။
ဥပမာ 2- နမူနာနှစ်ခု- Kolmogorov-Smirnov စမ်းသပ်မှု
ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာအတွဲနှစ်ခုရှိသည် ဆိုကြပါစို့။
from numpy.random import seed from numpy.random import randn from numpy.random import lognormal #set seed (eg make this example reproducible) seed(0) #generate two datasets data1 = randn(100) data2 = lognormal(3, 1, 100)
အောက်ပါကုဒ်သည် ဤနမူနာနှစ်ခုတွင် Kolmogorov-Smirnov စမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-
from scipy.stats import ks_2samp #perform Kolmogorov-Smirnov test ks_2samp(data1, data2) KstestResult(statistic=0.99, pvalue=4.417521386399011e-57)
ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.99 ဖြစ်ပြီး သက်ဆိုင်သော p-value သည် 4.4175e-57 ဖြစ်ကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။ နမူနာဒေတာအတွဲနှစ်ခုသည် တူညီသောဖြန့်ဝေမှုမှမဟုတ်ကြောင်း ပြောရန် လုံလောက်သော အထောက်အထားရှိသည်။
lognormal distribution ကို အသုံးပြု၍ ဒုတိယနမူနာအတွက် စံပုံမှန်ဖြန့်ဝေမှုနှင့် တန်ဖိုးများကို အသုံးပြုကာ ပထမနမူနာအတွက် တန်ဖိုးများကို ထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဟုတ်ပါ။
ထပ်လောင်းအရင်းအမြစ်များ
Python တွင် Shapiro-Wilk Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
Python တွင် Anderson-Darling Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။