စာရင်းအင်းဆိုင်ရာနှင့် လက်တွေ့ကျသော အရေးပါမှုကို ရိုးရှင်းသော ရှင်းလင်းချက်


Statistical hypothesis သည် လူဦးရေ ကန့်သတ်ချက် နှင့် ပတ်သက်သော ယူဆချက် တစ်ခု ဖြစ်သည်။ ဥပမာအားဖြင့်၊ ခရိုင်တစ်ခုရှိ အမျိုးသားတစ်ဦး၏ ပျမ်းမျှအရပ်သည် 68 လက်မဟု ကျွန်ုပ်တို့ ယူဆနိုင်သည်။ အရပ်နှင့်ပတ်သက်သော ယူဆချက်မှာ ကိန်းဂဏန်းဆိုင်ရာ အယူအဆ ဖြစ်ပြီး အမေရိကန်ပြည်ထောင်စုရှိ အမျိုးသားတစ်ဦး၏ ပျမ်းမျှအရပ်သည် လူဦးရေကန့်သတ်ချက် ဖြစ်သည်။

သီအိုရီစစ်ဆေးမှု သည် ကိန်းဂဏန်းဆိုင်ရာ ယူဆချက်တစ်ခုကို ငြင်းပယ်ရန် သို့မဟုတ် ပျက်ကွက်ရန် ကျွန်ုပ်တို့အသုံးပြုသည့် တရားဝင်စာရင်းအင်းဆိုင်ရာ စမ်းသပ်မှုတစ်ခုဖြစ်သည်။ သီအိုရီစမ်းသပ်ခြင်းလုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် လူဦးရေထံမှ ကျပန်းနမူနာကို ရယူပြီး null အယူအဆသည် အမှန်တကယ်မှန်သည်ဟု ပေး၍နမူနာရှိ ဒေတာသည် ဖြစ်ပေါ်လာဖွယ်ရှိမရှိကို ဆုံးဖြတ်ပါသည်။

နမူနာဒေတာသည် ဤယူဆချက်အောက်တွင် လုံလောက်စွာ မဖြစ်နိုင်ပါက၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ပယ်ချပြီး အကျိုးသက်ရောက်မှုတစ်ခုရှိကြောင်း ကောက်ချက်ချနိုင်ပါသည်။

သုညသည် မှန်သည်ဟု ယူဆသည့်နမူနာဒေတာသည် “ မဖြစ်နိုင်လောက်အောင်ဖြစ်နိုင်သည်” ဟုကျွန်ုပ်တို့ဆုံးဖြတ်သည့်နည်းလမ်းမှာ အချို့သောအရေးပါမှုအဆင့် (များသောအားဖြင့် 0.01၊ 0.05 သို့မဟုတ် 0.10 အဖြစ်ရွေးချယ်သည်)၊ ထို့နောက်ယူဆချက်စမ်းသပ်မှု၏ p-value လျော့နည်းခြင်းရှိမရှိစစ်ဆေးပါ။ ဒီအဆင့်ထက် အရေးကြီးပါတယ်။

p-value သည် အရေးပါမှုအဆင့်ထက်နည်းပါက၊ ရလဒ်များသည် ကိန်းဂဏန်းအရ သိသာထင်ရှား သည်ဟု ကျွန်ုပ်တို့ပြောပါသည်။ ဆိုလိုသည်မှာ သက်ရောက်မှုအချို့ရှိနေသည်ဟု ဆိုလိုသော်လည်း ဤအကျိုးသက်ရောက်မှုသည် လက်တွေ့ကမ္ဘာတွင် အမှန်တကယ်လက်တွေ့ကျသည်ဟု မဆိုလိုပါ။ ရလဒ်များသည် လက်တွေ့တွင် သိသာထင်ရှားမှုမရှိ ဘဲ ကိန်းဂဏန်းအရ သိသာထင်ရှားနိုင်ပါသည်။

ဆက်စပ်- P တန်ဖိုးများနှင့် စာရင်းအင်းဆိုင်ရာ အရေးပါမှုဆိုင်ရာ ရှင်းလင်းချက်

လက်တွေ့ကျဖို့ အရေးကြီးတယ်။

အကျိုးသက်ရောက်မှု အရွယ်အစားသေးငယ်သော်လည်း ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသောရလဒ်များ ထွက်ပေါ်လာစေရန် သီအိုရီစစ်ဆေးမှုအတွက် ဖြစ်နိုင်သည်။ သေးငယ်သောအကျိုးသက်ရောက်မှုအရွယ်အစားများသည် နိမ့်ကျသော (ထို့ကြောင့် စာရင်းအင်းအရသိသာထင်ရှားသော) p-တန်ဖိုးများကို ထုတ်လုပ်နိုင်သည့် အဓိကနည်းလမ်းနှစ်ခုရှိသည်။

1. နမူနာယူထားသောဒေတာ၏ ကွဲပြားမှုမှာ အလွန်နည်းပါသည်။ သင်၏နမူနာဒေတာတွင် ကွဲလွဲမှုနည်းပါးသောအခါ၊ အယူအဆစမ်းသပ်မှုတစ်ခုသည် လူဦးရေအကျိုးသက်ရောက်မှု၏ ခန့်မှန်းချက်များကို ပိုမိုတိကျစွာထုတ်လုပ်နိုင်ကာ စမ်းသပ်မှုမှ သေးငယ်သောအကျိုးသက်ရောက်မှုများကိုပင် သိရှိနိုင်မည်ဖြစ်သည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် မတူညီသောကျောင်းနှစ်ခုမှ ကျောင်းသား 20 ဦး၏ စာမေးပွဲရမှတ်များကို ဖော်ပြသည့် အောက်ပါနမူနာနှစ်ခုတွင် သီးခြားနမူနာနှစ်ခု t-test ပြုလုပ်လိုသည်ဆိုပါစို့။

 sample 1: 85 85 86 86 85 86 86 86 86 85 85 85 86 85 86 85 86 86 85 86
sample 2: 87 86 87 86 86 86 86 86 87 86 86 87 86 86 87 87 87 86 87 86

နမူနာ 1 ၏ ပျမ်းမျှသည် 85.55 ဖြစ်ပြီး နမူနာ 2 ၏ ပျမ်းမျှသည် 86.40 ဖြစ်သည်။ အမှီအခိုကင်းသောနမူနာနှစ်ခု t-test ကို ကျွန်ုပ်တို့လုပ်ဆောင်သောအခါ၊ စမ်းသပ်မှုစာရင်းအင်းသည် -5.3065 ဖြစ်ပြီး သက်ဆိုင်ရာ p-တန်ဖိုးသည် <0.0001 ဖြစ်သည် ။ စစ်ဆေးမှုရလဒ်များကြား ကွာခြားချက်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားပါသည်။

ဤနမူနာနှစ်ခုအတွက် ပျမ်းမျှ စာမေးပွဲရမှတ်များအကြား ကွာခြားချက်မှာ 0.85 သာရှိသော်လည်း ကျောင်းတစ်ခုစီအတွက် စာမေးပွဲရမှတ်များတွင် ကွဲလွဲမှုနည်းပါးခြင်းသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ရလဒ်တစ်ခုဖြစ်သည်။ နမူနာ 1 အတွက် 0.51 နှင့် နမူနာ 2 အတွက် 0.50 ရမှတ်များ၏ စံသွေဖည်မှုကို သတိပြုပါ။

ဤကွဲပြားမှုနည်းပါးခြင်းသည် ရမှတ်များကြားတွင် သေးငယ်သောကွာခြားချက်ကို သိရှိနိုင်စေရန်နှင့် ကွဲလွဲမှုများကို ကိန်းဂဏန်းအရ သိသာထင်ရှားစေမည့် သီအိုရီစစ်ဆေးမှုကို ခွင့်ပြုပေးခြင်းဖြစ်သည်။

ကွဲလွဲမှုနည်းပါးခြင်းသည် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော ကောက်ချက်များအား ဖြစ်ပေါ်စေနိုင်သည့် အရင်းခံအကြောင်းရင်းမှာ လွတ်လပ်သောနမူနာနှစ်ခု t-test အတွက် t- test ကိန်းဂဏန်းကို အောက်ပါအတိုင်း တွက်ချက်ထားသောကြောင့် ဖြစ်ပါသည်။

စမ်းသပ်စာရင်းအင်း t = [( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

s 2 1 နှင့် s 2 2 သည် နမူနာ 1 နှင့် နမူနာ 2 အတွက် နမူနာကွဲလွဲမှုကို ညွှန်ပြသည် ။ ဤဂဏန်းနှစ်လုံးသည် သေးငယ်သောအခါ၊ t- test ကိန်းဂဏန်း၏ ကိန်းပြည့်ပိုင်းခြေသည် သေးငယ်ကြောင်း သတိပြုပါ။

ဂဏန်းငယ်ဖြင့် ခွဲလိုက်သောအခါတွင် ဂဏန်းကြီးတစ်ခုရသွားပါသည်။ ဆိုလိုသည်မှာ t- test statistic သည် ကြီးမားမည်ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် သေးငယ်မည်ဖြစ်ပြီး၊ ထို့ကြောင့် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသောရလဒ်များကို ရရှိစေမည်ဖြစ်သည်။

2. နမူနာအရွယ်အစားသည် အလွန်ကြီးမားသည်။ နမူနာအရွယ်အစား ပိုကြီးလေ၊ အယူအဆစမ်းသပ်မှုတစ်ခု၏ ကိန်းဂဏန်းဆိုင်ရာ စွမ်းအား ကြီးမားလေလေ၊ ၎င်းအား သေးငယ်သော အကျိုးသက်ရောက်မှုများကိုပင် သိရှိနိုင်စေမည်ဖြစ်သည်။ လက်တွေ့တွင် အရေးပါမှု မရှိနိုင်သည့် သေးငယ်သော သက်ရောက်မှုများ ရှိနေသော်လည်း ၎င်းသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ရလဒ်များကို ဖြစ်ပေါ်စေနိုင်သည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် မတူညီသောကျောင်းနှစ်ခုမှ ကျောင်းသား 20 ဦး၏ စာမေးပွဲရမှတ်များကို ဖော်ပြသည့် အောက်ပါနမူနာနှစ်ခုတွင် သီးခြားနမူနာနှစ်ခု t-test ပြုလုပ်လိုသည်ဆိုပါစို့။

 Sample 1: 88 89 91 94 87 94 94 92 91 86 87 87 92 89 93 90 92 95 89 93
Sample 2: 95 88 93 87 89 90 86 90 95 89 91 92 91 88 94 93 94 87 93 90

ရမှတ်များ ဖြန့်ကျက်ပြသရန်အတွက် နမူနာတစ်ခုစီအတွက် boxplot တစ်ခုကို ဖန်တီးပါက၊ ၎င်းတို့သည် အလွန်ဆင်တူကြောင်း ကျွန်ုပ်တို့ တွေ့မြင်နိုင်သည်-

နမူနာ 1 ၏ပျမ်းမျှသည် 90.65 ဖြစ်ပြီး နမူနာ 2 ၏ပျမ်းမျှသည် 90.75 ဖြစ်သည်။ နမူနာ 1 အတွက် စံသွေဖည်မှုသည် 2.77 ဖြစ်ပြီး နမူနာ 2 အတွက် စံသွေဖည်မှုသည် 2.78 ဖြစ်သည်။ အမှီအခိုကင်းသောနမူနာနှစ်ခု t-test ကို ကျွန်ုပ်တို့လုပ်ဆောင်သောအခါ၊ စမ်းသပ်မှုစာရင်းအင်းသည် -0.113 ဖြစ်ပြီး သက်ဆိုင်ရာ p-တန်ဖိုးသည် 0.91 ဖြစ်သည်ကို တွေ့ရှိရသည်။ ပျမ်းမျှ စာမေးပွဲရမှတ်များအကြား ကွာခြားချက်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်း မရှိပါ။

သို့သော် နမူနာနှစ်ခု၏နမူနာအရွယ်အစားသည် 200 နှစ်ခုလုံးဖြစ်မဖြစ်ကို စဉ်းစားပါ။ ဤကိစ္စတွင်၊ သီးခြားနမူနာနှစ်ခု t-test သည် စမ်းသပ်မှုစာရင်းအင်းသည် -1.97 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.05 အောက်တွင်သာရှိကြောင်း ပြသမည်ဖြစ်သည်။ ပျမ်းမျှစာမေးပွဲရမှတ်များအကြား ကွာခြားချက်မှာ ကိန်းဂဏန်းအရ သိသာထင်ရှားပါသည်။

ကြီးမားသောနမူနာအရွယ်အစားများသည် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ကောက်ချက်များအား ဖြစ်ပေါ်စေနိုင်သည့် အရင်းခံအကြောင်းရင်းမှာ လွတ်လပ်သောနမူနာနှစ်ခု t-test အတွက် t- test ကိန်းဂဏန်းသို့ တစ်ဖန်ပြန်သွားသည်-

စမ်းသပ်စာရင်းအင်း t = [( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

n 1 နှင့် n 2 သည် သေးငယ်သောအခါ t -test statistic ၏ integer ပိုင်းခြေသည် သေးငယ်ကြောင်း သတိပြုပါ။ ဂဏန်းငယ်ဖြင့် ခွဲလိုက်သောအခါတွင် ဂဏန်းကြီးတစ်ခုရသွားပါသည်။ ဆိုလိုသည်မှာ t- test statistic သည် ကြီးမားမည်ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် သေးငယ်မည်ဖြစ်ပြီး၊ ထို့ကြောင့် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသောရလဒ်များကို ရရှိစေမည်ဖြစ်သည်။

လက်တွေ့ကျသော အရေးပါမှုကို အကဲဖြတ်ရန် ဘာသာရပ်ဆိုင်ရာ ကျွမ်းကျင်မှုကို အသုံးပြုပါ။

သီအိုရီစမ်းသပ်မှုမှ ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသောရလဒ်သည် လက်တွေ့ကျကျ အဓိပ္ပာယ်ရှိမရှိ ဆုံးဖြတ်ရန်၊ ဘာသာရပ်ဆိုင်ရာ ကျွမ်းကျင်မှုရှိရန် မကြာခဏ လိုအပ်ပါသည်။

ယခင်နမူနာများတွင်၊ ကျောင်းနှစ်ကျောင်းမှ စာမေးပွဲရမှတ်များအကြား ကွာခြားချက်များကို ကျွန်ုပ်တို့ စမ်းသပ်နေသောအခါတွင်၊ ကျောင်းများတွင် အလုပ်လုပ်သော သို့မဟုတ် စီမံခန့်ခွဲသူ၏ ပျမ်းမျှ ကွာခြားချက်ရှိမရှိ သိရှိနိုင်ရန် ကူညီပေးမည့် 1 ၏ ပျမ်းမျှကွာခြားချက်ရှိမရှိ သိရှိနိုင်ရန် အထောက်အကူဖြစ်စေရန်၊ အချက်ရှိသလား၊ မရှိဘူးလား။ လက်တွေ့ကျသောသက်ရောက်မှုများရှိသည်။

ဥပမာအားဖြင့်၊ 1 မှတ်၏ ပျမ်းမျှကွာဟချက်သည် alpha = 0.05 အဆင့်တွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားပေလိမ့်မည်၊ သို့သော် အနိမ့်ဆုံးရမှတ်များရှိသောကျောင်းသည် အမှတ်အများဆုံးရထားသောကျောင်းသည် ပိုမိုမြင့်မားအသုံးပြုသည့် ပရိုဂရမ်ကို လက်ခံသင့်သည်ဟု ဆိုလိုပါသလား။ သို့မဟုတ် စီမံခန့်ခွဲရေးစရိတ်များ အလွန်အကျွံပါဝင်ပြီး အကောင်အထည်ဖော်ရန် မြန်ဆန်လွန်းနေမည်လား။

ကျောင်းနှစ်ခုကြားရှိ စာမေးပွဲရမှတ်များတွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ခြားနားချက်ရှိသောကြောင့် ကွာခြားချက်၏ သက်ရောက်မှုအရွယ်အစားသည် ပညာရေးစနစ်တွင် အပြောင်းအလဲအမျိုးအစားအချို့ကို ဖြစ်စေနိုင်လောက်အောင် ကြီးမားသည်ဟု မဆိုလိုပါ။

လက်တွေ့ကျသော အရေးပါမှုကို အကဲဖြတ်ရန် ယုံကြည်မှုကြားကာလများကို အသုံးပြုခြင်း။

လက်တွေ့ကျသော အရေးပါမှုကို ဆုံးဖြတ်ရန် နောက်ထပ်အသုံးဝင်သောကိရိယာမှာ ယုံကြည်မှုကြားကာလ ဖြစ်သည်။ ယုံကြည်မှုကြားကာလတစ်ခုသည် ကျွန်ုပ်တို့အား စစ်မှန်သောလူဦးရေကန့်သတ်ချက်သည် လိမ်ညာဖွယ်ရှိသည့်တန်ဖိုးများအကွာအဝေးကိုပေးသည်။

ဥပမာအားဖြင့်၊ ကျောင်းနှစ်ကျောင်းကြားရှိ စာမေးပွဲရမှတ်များ ကွာခြားချက်ကို နှိုင်းယှဉ်ကြည့်ရအောင်။ ပရိုဂရမ်အသစ်တစ်ခုချမှတ်ရန် ကျောင်းအတွက် ပျမ်းမျှရမှတ်ကွာခြားချက် အနည်းဆုံး 5 မှတ် လိုအပ်ကြောင်း ကျောင်းအုပ်ကြီးက ကြေညာနိုင်သည်။

လေ့လာမှုတစ်ခုတွင်၊ စာမေးပွဲရမှတ်များအကြား ပျမ်းမျှကွာခြားချက်မှာ ၈ မှတ်ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ သို့သော်၊ ဤဆိုလိုရင်းပတ်၀န်းကျင်ယုံကြည်မှုကြားကာလသည် [4၊ 12] ဖြစ်နိုင်ပြီး၊ 4 သည် ပျမ်းမျှစမ်းသပ်မှုရလဒ်များကြားမှ စစ်မှန်သောကွာခြားချက်ဖြစ်နိုင်ကြောင်း ညွှန်ပြသည်။ ဤကိစ္စတွင်၊ ယုံကြည်စိတ်ချမှုကြားကာလသည် 5 ထက်နည်းနိုင်ကြောင်း ညွှန်ပြသောကြောင့် ကျောင်းမှ ပရိုဂရမ်ကို ပြောင်းလဲမည်မဟုတ်ကြောင်း ကျောင်းအုပ်မှ ကောက်ချက်ချနိုင်သည်။

သို့သော်၊ အခြားလေ့လာမှုတစ်ခုတွင် စမ်းသပ်မှုရလဒ်များကြား ပျမ်းမျှခြားနားချက်မှာ 8 မှတ်ဖြစ်သည်၊ သို့သော် ပျမ်းမျှယုံကြည်မှုကြားကာလသည် [6၊ 10] ဖြစ်နိုင်သည်။ ဤကြားကာလတွင် 5 မပါဝင်သောကြောင့် စာမေးပွဲရမှတ်များကြားမှ စစ်မှန်သောကွာခြားချက်မှာ 5 ထက်ကြီးသည်ဟု ဒါရိုက်တာမှ ကောက်ချက်ချနိုင်မည်ဖြစ်ပြီး ထို့ကြောင့် ပရိုဂရမ်ကို ပြုပြင်ရန် သင့်လျော်ကြောင်း ဆုံးဖြတ်မည်ဖြစ်သည်။

နိဂုံး

နိဂုံးချုပ်အားဖြင့်၊ ဤတွင်ကျွန်ုပ်တို့သင်ယူခဲ့သည်

  • စာရင်းအင်းဆိုင်ရာ တစ်ခုတည်းသော အရေးပါမှု သည် အချို့သော အရေးပါမှု အဆင့်ကို အခြေခံ၍ အကျိုးသက်ရောက်မှုရှိမရှိ ညွှန်ပြပါသည်။
  • လက်တွေ့ကျသော အရေးပါမှု မှာ ဤအကျိုးသက်ရောက်မှုသည် လက်တွေ့ကမ္ဘာတွင် လက်တွေ့ကျသောသက်ရောက်မှုများ ရှိ/မရှိဖြစ်သည်။
  • ကျွန်ုပ်တို့သည် စာရင်းအင်းဆိုင်ရာ အရေးပါမှုနှင့် လက်တွေ့ကျသော အရေးပါမှုကို အကဲဖြတ်ရန် ဒိုမိန်းကျွမ်းကျင်မှုကို ဆုံးဖြတ်ရန် ကိန်းဂဏန်းဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာမှုများကို အသုံးပြုပါသည်။
  • သေးငယ်သောအကျိုးသက်ရောက်မှုအရွယ်အစားများသည် (၁) နမူနာဒေတာ၏ပြောင်းလဲနိုင်မှုအလွန်သေးငယ်ပြီး (၂) နမူနာအရွယ်အစားသည် အလွန်ကြီးမားသောအခါတွင် သေးငယ်သောအကျိုးသက်ရောက်မှုအရွယ်အစားများထုတ်လုပ်နိုင်သည်။
  • အယူအဆစမ်းသပ်မှုတစ်ခုမပြုလုပ်မီ အနည်းဆုံးအကျိုးသက်ရောက်မှုအရွယ်အစားကို သတ်မှတ်ခြင်းဖြင့်၊ အယူအဆစမ်းသပ်မှုတစ်ခု၏ရလဒ် (ကိန်းဂဏန်းအရသိသာထင်ရှားသည့်တိုင်) လက်တွေ့ကမ္ဘာတွင် အမှန်တကယ်လက်တွေ့ကျခြင်းရှိမရှိ ပိုမိုကောင်းမွန်စွာအကဲဖြတ်နိုင်ပါသည်။
  • ယုံကြည်မှုကြားကာလများသည် လက်တွေ့ကျသော အရေးပါမှုကို ဆုံးဖြတ်ရာတွင် အသုံးဝင်ပါသည်။ အနိမ့်ဆုံးအကျိုးသက်ရောက်မှုအရွယ်အစားသည် ယုံကြည်မှုကြားကာလတစ်ခုအတွင်းမဟုတ်ပါက၊ ရလဒ်များသည် လက်တွေ့တွင် သိသာထင်ရှားပေမည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်