Python တွင် ယုံကြည်မှုကြားကာလများကို တွက်ချက်နည်း
ဆိုလိုရင်းတစ်ခုအတွက် ယုံကြည်မှုကြားကာလ သည် အတိုင်းအတာတစ်ခုအထိ ယုံကြည်စိတ်ချမှုအဆင့်တစ်ခုရှိ လူဦးရေဆိုလိုးပါ၀င်နိုင်ခြေရှိသော တန်ဖိုးများဖြစ်သည်။
အောက်ပါအတိုင်း တွက်ချက်သည်။
ယုံကြည်မှုကြားကာလ = x +/- t*(s/√n)
ရွှေ-
- x : နမူနာကို ဆိုလိုသည်။
- t: ယုံကြည်မှုအဆင့်နှင့် ကိုက်ညီသော တန်ဖိုး
- s: နမူနာစံသွေဖည်
- n: နမူနာအရွယ်အစား
ဤသင်ခန်းစာတွင် Python ရှိ ယုံကြည်မှုကြားကာလများကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။
t ဖြန့်ဖြူးမှုကို အသုံးပြု၍ ယုံကြည်မှုကြားကာလများ
အကယ်၍ ကျွန်ုပ်တို့သည် နမူနာအသေးစား (n < 30) ဖြင့် လုပ်ဆောင်နေပါက လူဦးရေဆိုလိုရင်းအတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် scipy.stats စာကြည့်တိုက်မှ t.interval() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
အောက်ဖော်ပြပါ ဥပမာသည် အပင် 15 မျိုး၏နမူနာကို အသုံးပြု၍ အပင်မျိုးစိတ်တစ်ခု၏ ပျမ်းမျှလူဦးရေ အရပ်အမြင့် (လက်မအတွင်း) အတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်နည်းကို ပြသသည်-
import numpy as np import scipy.stats as st #define sample data data = [12, 12, 13, 13, 15, 16, 17, 22, 23, 25, 26, 27, 28, 28, 29] #create 95% confidence interval for population mean weight st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (16.758, 24.042)
စစ်မှန်သောပျမ်းမျှလူဦးရေအရွယ်အစားအတွက် 95% ယုံကြည်မှုကြားကာလသည် (16.758၊ 24.042) ဖြစ်သည်။
ယုံကြည်မှုအဆင့်မြင့်လေ၊ ယုံကြည်မှုကြားကာလ ကျယ်လေလေဖြစ်ကြောင်း သတိပြုမိပါလိမ့်မည်။ ဥပမာအားဖြင့်၊ ဤနေရာတွင် တူညီသောဒေတာအတွက် 99% CI ကို တွက်ချက်နည်း။
#create 99% confidence interval for same sample st.t.interval(alpha= 0.99 , df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (15.348, 25.455)
စစ်မှန်သောပျမ်းမျှလူဦးရေအရွယ်အစားအတွက် 99% ယုံကြည်မှုကြားကာလသည် (15.348၊ 25.455) ဖြစ်သည်။ ဤကြားကာလသည် ယခင် 95% ယုံကြည်မှုကြားကာလထက် ပိုကျယ်ကြောင်း သတိပြုပါ။
ပုံမှန်ဖြန့်ဖြူးမှုကို အသုံးပြု၍ ယုံကြည်မှုကြားကာလများ
ကျွန်ုပ်တို့သည် ပိုကြီးသောနမူနာများ (n≥30) ဖြင့် လုပ်ဆောင်နေပါက၊ နမူနာဆိုလိုး၏နမူနာဖြန့်ဝေမှုသည် ပုံမှန်အားဖြင့် ဖြန့်ဝေသည် ( ဗဟိုကန့်သတ်သီအိုရီ ကိုကျေးဇူးတင်လျက်) အစား norm လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။ scipy .stats စာကြည့်တိုက်မှ interval() ။
အောက်ဖော်ပြပါ ဥပမာသည် အပင်မျိုးစိတ် 50 ၏နမူနာကို အသုံးပြု၍ အပင်မျိုးစိတ်များ၏ စစ်မှန်သောပျမ်းမျှလူဦးရေအမြင့် (လက်မအတွင်း) အတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်နည်းကို ပြသသည်-
import numpy as np import scipy.stats as st #define sample data np.random.seed(0) data = np.random.randint(10, 30, 50) #create 95% confidence interval for population mean weight st.norm.interval(alpha=0.95, loc=np.mean(data), scale=st.sem(data)) (17.40, 21.08)
စစ်မှန်သောပျမ်းမျှလူဦးရေအရွယ်အစားအတွက် 95% ယုံကြည်မှုကြားကာလသည် (17.40၊ 21.08) ဖြစ်သည်။
t ဖြန့်ဖြူးမှုကဲ့သို့ပင်၊ ပိုမိုမြင့်မားသောယုံကြည်မှုအဆင့်များသည် ပိုမိုကျယ်ပြန့်သောယုံကြည်မှုကြားကာလများကိုဖြစ်ပေါ်စေသည်။ ဥပမာအားဖြင့်၊ ဤနေရာတွင် တူညီသောဒေတာအတွက် 99% CI ကို တွက်ချက်နည်း။
#create 99% confidence interval for same sample st.norm.interval(alpha= 0.99 , loc=np.mean(data), scale=st.sem(data)) (16.82, 21.66)
စစ်မှန်သောပျမ်းမျှလူဦးရေအရွယ်အစားအတွက် 95% ယုံကြည်မှုကြားကာလသည် (17.82၊ 21.66) ဖြစ်သည်။
ယုံကြည်မှုကြားကာလကို ဘယ်လိုအဓိပ္ပာယ်ဖွင့်မလဲ။
အပင်မျိုးစိတ်များ၏ စစ်မှန်သောပျမ်းမျှအမြင့်အတွက် ကျွန်ုပ်တို့၏ 95% ယုံကြည်မှုကြားကာလကို ယူဆပါ-
ယုံကြည်မှုကြားကာလ 95% = (16.758၊ 24.042)
ဤယုံကြည်မှုကြားကာလကို အဓိပ္ပာယ်ဖွင့်ဆိုရန်နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
[16.758၊ 24.042] ၏ယုံကြည်မှုကြားကာလသည် လူဦးရေ၏စစ်မှန်သောပျမ်းမျှအပင်အမြင့်ပါ၀င်ရန် 95% အခွင့်အလမ်းရှိသည်။
တူညီသောအချက်ကိုပြောခြင်း၏နောက်တစ်နည်းမှာ အစစ်အမှန်လူဦးရေဆိုလိုသည်မှာ 95% ယုံကြည်မှုကြားကာလပြင်ပတွင်ရှိနေရန် 5% သာအခွင့်အရေးရှိသည်။ ဆိုလိုသည်မှာ၊ အမှန်တကယ်ပင်ပျမ်းမျှအမြင့်သည် 16.758 လက်မ (သို့) 24.042 လက်မထက် ပိုနည်းနိုင်ခြေ 5% သာရှိပါသည်။