Python တွင် kolmogorov-smirnov စမ်းသပ်မှုပြုလုပ်နည်း


Kolmogorov-Smirnov စမ်းသပ်မှုကို နမူနာတစ်ခုသည် ဖြန့်ဖြူးမှုတစ်ခုမှ ထွက်ပေါ်လာခြင်း ရှိ၊ မရှိ စမ်းသပ်ရန် အသုံးပြုသည်။

Python တွင် Kolmogorov-Smirnov စမ်းသပ်မှုပြုလုပ်ရန်၊ နမူနာနှစ်ခုစမ်းသပ်မှုတစ်ခုအတွက် scipy.stats.kstest() သို့မဟုတ် scipy.stats.ks_2samp() ကို အသုံးပြုနိုင်ပါသည်။

ဤသင်ခန်းစာတွင် လုပ်ဆောင်ချက်တစ်ခုစီကို လက်တွေ့အသုံးချနည်းကို နမူနာပြထားသည်။

ဥပမာ 1- Kolmogorov-Smirnov စမ်းသပ်မှုနမူနာ

ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာရှိသည်ဆိုပါစို့။

 from numpy.random import seed
from numpy.random import fish

#set seed (eg make this example reproducible)
seed(0)

#generate dataset of 100 values that follows a Poisson distribution with mean=5
data = fish(5, 100)

အောက်ပါကုဒ်သည် ပုံမှန်ဖြန့်ဝေမှုမှ ဆင်းသက်ခြင်းရှိမရှိ ဆုံးဖြတ်ရန် ဤဒေတာတန်ဖိုး 100 ၏ နမူနာတွင် Kolmogorov-Smirnov စမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-

 from scipy.stats import kstest

#perform Kolmogorov-Smirnov test
kstest(data, ' norm ')

KstestResult(statistic=0.9072498680518208, pvalue=1.0908062873170218e-103)

ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.9072 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 1.0908e-103 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။ နမူနာဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုမှ လာသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။

Poisson ဖြန့်ဝေမှု နောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုးများကိုထုတ်ပေးသည့် Poisson() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ နမူနာဒေတာကိုထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဟုတ်ပါ။

ဥပမာ 2- နမူနာနှစ်ခု- Kolmogorov-Smirnov စမ်းသပ်မှု

ကျွန်ုပ်တို့တွင် အောက်ပါနမူနာဒေတာအတွဲနှစ်ခုရှိသည် ဆိုကြပါစို့။

 from numpy.random import seed
from numpy.random import randn
from numpy.random import lognormal

#set seed (eg make this example reproducible)
seed(0)

#generate two datasets
data1 = randn(100)
data2 = lognormal(3, 1, 100)

အောက်ပါကုဒ်သည် ဤနမူနာနှစ်ခုတွင် Kolmogorov-Smirnov စမ်းသပ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-

 from scipy.stats import ks_2samp

#perform Kolmogorov-Smirnov test
ks_2samp(data1, data2)

KstestResult(statistic=0.99, pvalue=4.417521386399011e-57)

ရလဒ်မှ၊ စမ်းသပ်စာရင်းအင်းသည် 0.99 ဖြစ်ပြီး သက်ဆိုင်သော p-value သည် 4.4175e-57 ဖြစ်ကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။ နမူနာဒေတာအတွဲနှစ်ခုသည် တူညီသောဖြန့်ဝေမှုမှမဟုတ်ကြောင်း ပြောရန် လုံလောက်သော အထောက်အထားရှိသည်။

lognormal distribution ကို အသုံးပြု၍ ဒုတိယနမူနာအတွက် စံပုံမှန်ဖြန့်ဝေမှုနှင့် တန်ဖိုးများကို အသုံးပြုကာ ပထမနမူနာအတွက် တန်ဖိုးများကို ထုတ်ပေးသည့်အတွက်ကြောင့် ဤရလဒ်သည် အံ့သြစရာမဟုတ်ပါ။

ထပ်လောင်းအရင်းအမြစ်များ

Python တွင် Shapiro-Wilk Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
Python တွင် Anderson-Darling Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်