Python တွင် hypothesis testing လုပ်နည်း (ဥပမာများဖြင့်)


သီအိုရီစစ်ဆေးမှု သည် ကိန်းဂဏန်းဆိုင်ရာ ယူဆချက်တစ်ခုကို ငြင်းပယ်ရန် သို့မဟုတ် ပျက်ကွက်ရန် ကျွန်ုပ်တို့အသုံးပြုသည့် တရားဝင်စာရင်းအင်းဆိုင်ရာ စမ်းသပ်မှုတစ်ခုဖြစ်သည်။

ဤသင်ခန်းစာတွင် Python တွင် အောက်ပါယူဆချက်စမ်းသပ်မှုများကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။

  • နမူနာ t စမ်းသပ်မှု
  • နမူနာ T-test နှစ်ခု
  • တွဲထားသော နမူနာများ t-test

သွားကြရအောင်!

ဥပမာ 1- Python တွင် t-test နမူနာတစ်ခု

နမူနာတစ်ခု t-test ကို လူဦးရေ၏ပျမ်းမျှတန်ဖိုးသည် အချို့သောတန်ဖိုးနှင့် ညီမျှခြင်းရှိ၊မရှိ စမ်းသပ်ရန်အသုံးပြုသည်။

ဥပမာအားဖြင့်၊ အချို့သောလိပ်မျိုးစိတ်များ၏ ပျမ်းမျှအလေးချိန်မှာ ပေါင် ၃၁၀ ရှိ၊မရှိ သိလိုသည်ဆိုကြပါစို့။

၎င်းကို စမ်းသပ်ရန်အတွက် အောက်ပါအလေးချိန်များဖြင့် လိပ်များ၏ ရိုးရှင်းသော ကျပန်းနမူနာကို စုဆောင်းပါသည်။

အလေးချိန် : 300၊ 315၊ 320၊ 311၊ 314၊ 309၊ 300၊ 308၊ 305၊ 303၊ 305၊ 301၊ 303

နမူနာ t-test တစ်ခုကို လုပ်ဆောင်ရန် အောက်ပါ ကုဒ်သည် scipy.stats စာကြည့်တိုက်ရှိ ttest_1samp() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 import scipy.stats as stats

#define data
data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]

#perform one sample t-test
stats. ttest_1samp (a=data, popmean= 310 )

Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)

t-test statistic သည် -1.5848 ဖြစ်ပြီး ဆက်စပ်နေသော two-tailed p-value သည် 0.1389 ဖြစ်သည်။

နမူနာတစ်ခုပေါ်ရှိ ဤ t-test အတွက် ယူဆချက်နှစ်ခုမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • H 0 : µ = 310 (လိပ်မျိုးစိတ်၏ ပျမ်းမျှအလေးချိန်မှာ ၃၁၀ ပေါင်)၊
  • H A : µ ≠310 (ပျမ်းမျှအလေးချိန် ပေါင် 310 မဟုတ်ပါ )

ကျွန်ုပ်တို့၏စမ်းသပ်မှု၏ p-value (0.1389) သည် alpha = 0.05 ထက်ကြီးသောကြောင့်၊ စာမေးပွဲ၏ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။

ဤလိပ်မျိုးစိတ်များ၏ ပျမ်းမျှအလေးချိန်မှာ ပေါင် ၃၁၀ မှလွဲ၍ အခြားမည်သည့်အရာမျှမရှိကြောင်း ပြောရန် လုံလောက်သော အထောက်အထားမရှိပါ။

ဥပမာ 2- Python တွင် နမူနာ t-test နှစ်ခု

နမူနာနှစ်ခု t-test ကို လူဦးရေ နှစ်ခု၏ အဓိပ္ပါယ်သည် ညီမျှခြင်း ရှိ၊ မရှိ စမ်းသပ်ရန် အသုံးပြုပါသည်။

ဥပမာအားဖြင့်၊ မတူညီသောလိပ်မျိုးစိတ်နှစ်ခု၏ ပျမ်းမျှအလေးချိန်သည် ညီမျှခြင်းရှိမရှိ သိလိုသည်ဆိုပါစို့။

၎င်းကို စမ်းသပ်ရန်အတွက် အောက်ပါအလေးချိန်များဖြင့် မျိုးစိတ်တစ်ခုစီမှ ရိုးရှင်းသော ကျပန်းနမူနာကို လိပ်များကို စုဆောင်းပါသည်။

နမူနာ 1 : 300၊ 315၊ 320၊ 311၊ 314၊ 309၊ 300၊ 308၊ 305၊ 303၊ 305၊ 301၊ 303

နမူနာ 2 : 335၊ 329၊ 322၊ 321၊ 324၊ 319၊ 304၊ 308၊ 305၊ 311၊ 307၊ 300၊ 305

အောက်ပါကုဒ်သည် ဤ t-test နမူနာနှစ်ခုကိုလုပ်ဆောင်ရန် scipy.stats စာကြည့်တိုက်ရှိ ttest_ind() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 import scipy. stats as stats

#define array of turtle weights for each sample
sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]
sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305]

#perform two sample t-tests
stats. ttest_ind (a=sample1, b=sample2) 

Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)

t-test statistic သည် -2.1009 ဖြစ်ပြီး သက်ဆိုင်ရာ အမြီးနှစ်ခု p-value သည် 0.0463 ဖြစ်သည်။

ဤအထူးသဖြင့် နမူနာနှစ်ခု t-test အတွက် ယူဆချက်နှစ်ခုမှာ-

  • H 0 : µ 1 = µ 2 (မျိုးစိတ်နှစ်ခုကြားရှိ ပျမ်းမျှအလေးချိန်သည် ညီမျှသည်)
  • H A : µ 1 ≠ µ 2 (မျိုးစိတ်နှစ်ခုကြားရှိ ပျမ်းမျှအလေးချိန် မညီမျှပါ)

စစ်ဆေးမှု၏ p-value (0.0463) သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။

ဆိုလိုသည်မှာ မျိုးစိတ်နှစ်ခုကြားရှိ ပျမ်းမျှအလေးချိန်သည် မညီမျှဟု ဆိုရန် လုံလောက်သော သက်သေအထောက်အထားများ ကျွန်ုပ်တို့တွင်ရှိသည်ကို ဆိုလိုပါသည်။

ဥပမာ 3- Python တွင် Paired Samples t-test

နမူနာတစ်ခုရှိ ရှုမြင်မှုတစ်ခုစီရှိ အခြားနမူနာတစ်ခုရှိ စူးစမ်းမှုတစ်ခုနှင့် ဆက်စပ်နိုင်သောအခါ နမူနာနှစ်ခု၏နည်းလမ်းကို နှိုင်းယှဉ်ရန် တွဲထားသောနမူနာကို t-test ကို အသုံးပြုသည်။

ဥပမာအားဖြင့်၊ လေ့ကျင့်ရေးအစီအစဉ်တစ်ခုသည် ဘတ်စကက်ဘောကစားသမားများ၏ အမြင့်ဆုံးဒေါင်လိုက်ခုန်ခြင်း (လက်မအတွင်း) ကို တိုးမြှင့်ပေးနိုင်ခြင်း ရှိ၊ မရှိ သိလိုသည်ဆိုကြပါစို့။

၎င်းကိုစမ်းသပ်ရန်အတွက်၊ ကျွန်ုပ်တို့သည် ကောလိပ်ဘတ်စကတ်ဘောကစားသမား ၁၂ ဦး၏ ရိုးရှင်းသောကျပန်းနမူနာကို စုဆောင်းနိုင်ပြီး ၎င်းတို့၏ အများဆုံး ဒေါင်လိုက်ခုန်ခြင်းများကို တိုင်းတာနိုင်သည်။ ထို့နောက် ကစားသမားတစ်ဦးစီအား တစ်လကြာ လေ့ကျင့်ရေးအစီအစဉ်ကို အသုံးပြုကာ လကုန်တွင် ၎င်းတို့၏အမြင့်ဆုံးဒေါင်လိုက်ခုန်ခြင်းကို ထပ်မံတိုင်းတာနိုင်သည်။

အောက်ပါအချက်အလက်များသည် ကစားသမားတစ်ဦးစီအတွက် လေ့ကျင့်ရေးပရိုဂရမ်ကို အသုံးမပြုမီနှင့် အပြီးတွင် အများဆုံးခုန်နိုင်သောအမြင့် (လက်မဖြင့်) ပြသသည်-

ရှေ့ : 22၊ 24၊ 20၊ 19၊ 19၊ 20၊ 22၊ 25၊ 24၊ 23၊ 22၊ 21

ပြီးနောက် : 23၊ 25၊ 20၊ 24၊ 18၊ 22၊ 23၊ 28၊ 24၊ 25၊ 24၊ 20

အောက်ပါကုဒ်သည် ဤတွဲစပ်ထားသောနမူနာ t-test ကိုလုပ်ဆောင်ရန် scipy.stats စာကြည့်တိုက်ရှိ ttest_rel() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 import scipy. stats as stats

#define before and after max jump heights
before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21]
after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20]

#perform paired samples t-test
stats. ttest_rel (a=before, b=after)

Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)

t-test statistic သည် -2.5289 ဖြစ်ပြီး သက်ဆိုင်ရာ အမြီးနှစ်ခု p-value သည် 0.0280 ဖြစ်သည်။

ဤအထူးတွဲစပ်ထားသော နမူနာ t-test အတွက် ယူဆချက်နှစ်ခုမှာ-

  • H 0 : µ 1 = µ 2 (ပရိုဂရမ်ကို အသုံးမပြုမီနှင့် ခုန်ပြီးနောက် ပျမ်းမျှအမြင့်သည် ညီမျှသည်)
  • H A : µ 1 ≠ µ 2 (ပရိုဂရမ်ကို အသုံးမပြုမီနှင့် ပြီးနောက် ခုန်ခြင်း၏ ပျမ်းမျှအမြင့်သည် မညီမျှပါ)

စစ်ဆေးမှု၏ p-value (0.0280) သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။

ဆိုလိုသည်မှာ လေ့ကျင့်ရေးပရိုဂရမ်ကို အသုံးမပြုမီနှင့် အပြီးတွင် ပျမ်းမျှခုန်နှုန်းသည် ညီမျှခြင်းမရှိဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။

ထပ်လောင်းအရင်းအမြစ်များ

t-test အမျိုးမျိုးကို အလိုအလျောက်လုပ်ဆောင်ရန် အောက်ပါအွန်လိုင်းဂဏန်းတွက်စက်များကို သင်အသုံးပြုနိုင်သည်-

t-test calculator ၏ဥပမာ
နမူနာ t-test ဂဏန်းတွက်စက် နှစ်ခု
Paired Samples t-Test Calculator

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်