Python တွင် hypothesis testing လုပ်နည်း (ဥပမာများဖြင့်)
သီအိုရီစစ်ဆေးမှု သည် ကိန်းဂဏန်းဆိုင်ရာ ယူဆချက်တစ်ခုကို ငြင်းပယ်ရန် သို့မဟုတ် ပျက်ကွက်ရန် ကျွန်ုပ်တို့အသုံးပြုသည့် တရားဝင်စာရင်းအင်းဆိုင်ရာ စမ်းသပ်မှုတစ်ခုဖြစ်သည်။
ဤသင်ခန်းစာတွင် Python တွင် အောက်ပါယူဆချက်စမ်းသပ်မှုများကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။
- နမူနာ t စမ်းသပ်မှု
- နမူနာ T-test နှစ်ခု
- တွဲထားသော နမူနာများ t-test
သွားကြရအောင်!
ဥပမာ 1- Python တွင် t-test နမူနာတစ်ခု
နမူနာတစ်ခု t-test ကို လူဦးရေ၏ပျမ်းမျှတန်ဖိုးသည် အချို့သောတန်ဖိုးနှင့် ညီမျှခြင်းရှိ၊မရှိ စမ်းသပ်ရန်အသုံးပြုသည်။
ဥပမာအားဖြင့်၊ အချို့သောလိပ်မျိုးစိတ်များ၏ ပျမ်းမျှအလေးချိန်မှာ ပေါင် ၃၁၀ ရှိ၊မရှိ သိလိုသည်ဆိုကြပါစို့။
၎င်းကို စမ်းသပ်ရန်အတွက် အောက်ပါအလေးချိန်များဖြင့် လိပ်များ၏ ရိုးရှင်းသော ကျပန်းနမူနာကို စုဆောင်းပါသည်။
အလေးချိန် : 300၊ 315၊ 320၊ 311၊ 314၊ 309၊ 300၊ 308၊ 305၊ 303၊ 305၊ 301၊ 303
နမူနာ t-test တစ်ခုကို လုပ်ဆောင်ရန် အောက်ပါ ကုဒ်သည် scipy.stats စာကြည့်တိုက်ရှိ ttest_1samp() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-
import scipy.stats as stats #define data data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] #perform one sample t-test stats. ttest_1samp (a=data, popmean= 310 ) Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)
t-test statistic သည် -1.5848 ဖြစ်ပြီး ဆက်စပ်နေသော two-tailed p-value သည် 0.1389 ဖြစ်သည်။
နမူနာတစ်ခုပေါ်ရှိ ဤ t-test အတွက် ယူဆချက်နှစ်ခုမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- H 0 : µ = 310 (လိပ်မျိုးစိတ်၏ ပျမ်းမျှအလေးချိန်မှာ ၃၁၀ ပေါင်)၊
- H A : µ ≠310 (ပျမ်းမျှအလေးချိန် ပေါင် 310 မဟုတ်ပါ )
ကျွန်ုပ်တို့၏စမ်းသပ်မှု၏ p-value (0.1389) သည် alpha = 0.05 ထက်ကြီးသောကြောင့်၊ စာမေးပွဲ၏ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။
ဤလိပ်မျိုးစိတ်များ၏ ပျမ်းမျှအလေးချိန်မှာ ပေါင် ၃၁၀ မှလွဲ၍ အခြားမည်သည့်အရာမျှမရှိကြောင်း ပြောရန် လုံလောက်သော အထောက်အထားမရှိပါ။
ဥပမာ 2- Python တွင် နမူနာ t-test နှစ်ခု
နမူနာနှစ်ခု t-test ကို လူဦးရေ နှစ်ခု၏ အဓိပ္ပါယ်သည် ညီမျှခြင်း ရှိ၊ မရှိ စမ်းသပ်ရန် အသုံးပြုပါသည်။
ဥပမာအားဖြင့်၊ မတူညီသောလိပ်မျိုးစိတ်နှစ်ခု၏ ပျမ်းမျှအလေးချိန်သည် ညီမျှခြင်းရှိမရှိ သိလိုသည်ဆိုပါစို့။
၎င်းကို စမ်းသပ်ရန်အတွက် အောက်ပါအလေးချိန်များဖြင့် မျိုးစိတ်တစ်ခုစီမှ ရိုးရှင်းသော ကျပန်းနမူနာကို လိပ်များကို စုဆောင်းပါသည်။
နမူနာ 1 : 300၊ 315၊ 320၊ 311၊ 314၊ 309၊ 300၊ 308၊ 305၊ 303၊ 305၊ 301၊ 303
နမူနာ 2 : 335၊ 329၊ 322၊ 321၊ 324၊ 319၊ 304၊ 308၊ 305၊ 311၊ 307၊ 300၊ 305
အောက်ပါကုဒ်သည် ဤ t-test နမူနာနှစ်ခုကိုလုပ်ဆောင်ရန် scipy.stats စာကြည့်တိုက်ရှိ ttest_ind() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
import scipy. stats as stats #define array of turtle weights for each sample sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305] #perform two sample t-tests stats. ttest_ind (a=sample1, b=sample2) Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)
t-test statistic သည် -2.1009 ဖြစ်ပြီး သက်ဆိုင်ရာ အမြီးနှစ်ခု p-value သည် 0.0463 ဖြစ်သည်။
ဤအထူးသဖြင့် နမူနာနှစ်ခု t-test အတွက် ယူဆချက်နှစ်ခုမှာ-
- H 0 : µ 1 = µ 2 (မျိုးစိတ်နှစ်ခုကြားရှိ ပျမ်းမျှအလေးချိန်သည် ညီမျှသည်)
- H A : µ 1 ≠ µ 2 (မျိုးစိတ်နှစ်ခုကြားရှိ ပျမ်းမျှအလေးချိန် မညီမျှပါ)
စစ်ဆေးမှု၏ p-value (0.0463) သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။
ဆိုလိုသည်မှာ မျိုးစိတ်နှစ်ခုကြားရှိ ပျမ်းမျှအလေးချိန်သည် မညီမျှဟု ဆိုရန် လုံလောက်သော သက်သေအထောက်အထားများ ကျွန်ုပ်တို့တွင်ရှိသည်ကို ဆိုလိုပါသည်။
ဥပမာ 3- Python တွင် Paired Samples t-test
နမူနာတစ်ခုရှိ ရှုမြင်မှုတစ်ခုစီရှိ အခြားနမူနာတစ်ခုရှိ စူးစမ်းမှုတစ်ခုနှင့် ဆက်စပ်နိုင်သောအခါ နမူနာနှစ်ခု၏နည်းလမ်းကို နှိုင်းယှဉ်ရန် တွဲထားသောနမူနာကို t-test ကို အသုံးပြုသည်။
ဥပမာအားဖြင့်၊ လေ့ကျင့်ရေးအစီအစဉ်တစ်ခုသည် ဘတ်စကက်ဘောကစားသမားများ၏ အမြင့်ဆုံးဒေါင်လိုက်ခုန်ခြင်း (လက်မအတွင်း) ကို တိုးမြှင့်ပေးနိုင်ခြင်း ရှိ၊ မရှိ သိလိုသည်ဆိုကြပါစို့။
၎င်းကိုစမ်းသပ်ရန်အတွက်၊ ကျွန်ုပ်တို့သည် ကောလိပ်ဘတ်စကတ်ဘောကစားသမား ၁၂ ဦး၏ ရိုးရှင်းသောကျပန်းနမူနာကို စုဆောင်းနိုင်ပြီး ၎င်းတို့၏ အများဆုံး ဒေါင်လိုက်ခုန်ခြင်းများကို တိုင်းတာနိုင်သည်။ ထို့နောက် ကစားသမားတစ်ဦးစီအား တစ်လကြာ လေ့ကျင့်ရေးအစီအစဉ်ကို အသုံးပြုကာ လကုန်တွင် ၎င်းတို့၏အမြင့်ဆုံးဒေါင်လိုက်ခုန်ခြင်းကို ထပ်မံတိုင်းတာနိုင်သည်။
အောက်ပါအချက်အလက်များသည် ကစားသမားတစ်ဦးစီအတွက် လေ့ကျင့်ရေးပရိုဂရမ်ကို အသုံးမပြုမီနှင့် အပြီးတွင် အများဆုံးခုန်နိုင်သောအမြင့် (လက်မဖြင့်) ပြသသည်-
ရှေ့ : 22၊ 24၊ 20၊ 19၊ 19၊ 20၊ 22၊ 25၊ 24၊ 23၊ 22၊ 21
ပြီးနောက် : 23၊ 25၊ 20၊ 24၊ 18၊ 22၊ 23၊ 28၊ 24၊ 25၊ 24၊ 20
အောက်ပါကုဒ်သည် ဤတွဲစပ်ထားသောနမူနာ t-test ကိုလုပ်ဆောင်ရန် scipy.stats စာကြည့်တိုက်ရှိ ttest_rel() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
import scipy. stats as stats #define before and after max jump heights before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21] after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20] #perform paired samples t-test stats. ttest_rel (a=before, b=after) Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)
t-test statistic သည် -2.5289 ဖြစ်ပြီး သက်ဆိုင်ရာ အမြီးနှစ်ခု p-value သည် 0.0280 ဖြစ်သည်။
ဤအထူးတွဲစပ်ထားသော နမူနာ t-test အတွက် ယူဆချက်နှစ်ခုမှာ-
- H 0 : µ 1 = µ 2 (ပရိုဂရမ်ကို အသုံးမပြုမီနှင့် ခုန်ပြီးနောက် ပျမ်းမျှအမြင့်သည် ညီမျှသည်)
- H A : µ 1 ≠ µ 2 (ပရိုဂရမ်ကို အသုံးမပြုမီနှင့် ပြီးနောက် ခုန်ခြင်း၏ ပျမ်းမျှအမြင့်သည် မညီမျှပါ)
စစ်ဆေးမှု၏ p-value (0.0280) သည် 0.05 ထက်နည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ပါသည်။
ဆိုလိုသည်မှာ လေ့ကျင့်ရေးပရိုဂရမ်ကို အသုံးမပြုမီနှင့် အပြီးတွင် ပျမ်းမျှခုန်နှုန်းသည် ညီမျှခြင်းမရှိဟု ဆိုရန် လုံလောက်သော အထောက်အထားရှိသည်။
ထပ်လောင်းအရင်းအမြစ်များ
t-test အမျိုးမျိုးကို အလိုအလျောက်လုပ်ဆောင်ရန် အောက်ပါအွန်လိုင်းဂဏန်းတွက်စက်များကို သင်အသုံးပြုနိုင်သည်-
t-test calculator ၏ဥပမာ
နမူနာ t-test ဂဏန်းတွက်စက် နှစ်ခု
Paired Samples t-Test Calculator