Python တွင် bootstrapping လုပ်နည်း (ဥပမာနှင့်အတူ)
Bootstrapping သည် နမူနာ အရွယ်အစား သေးငယ်ပြီး အရင်းခံ ဖြန့်ဝေမှုကို မသိသောအခါ ကိန်းဂဏန်း တစ်ခုအတွက် ယုံကြည်မှုကြားကာလကို တည်ဆောက်ရန် အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။
bootstrapping အတွက် အခြေခံလုပ်ငန်းစဉ်မှာ အောက်ပါအတိုင်းဖြစ်သည်။
- ပေးထားသောဒေတာအစုံမှ အစားထိုးခြင်းဖြင့် k နမူနာများကို ပုံတူပွားယူပါ။
- နမူနာတစ်ခုစီအတွက် အတိုးနှုန်းစာရင်းကို တွက်ချက်ပါ။
- ၎င်းသည် ပေးထားသော ကိန်းဂဏန်းတစ်ခုအတွက် မတူညီသော ခန့်မှန်းချက်များကို ပေးသည်၊ ထို့နောက် ကိန်းဂဏန်းအတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် သင်အသုံးပြုနိုင်သည်။
Python တွင် bootstrap လုပ်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ SciPy စာကြည့်တိုက်မှ bootstrap လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ- Python တွင် bootstrapping လုပ်ဆောင်ခြင်း။
ကျွန်ုပ်တို့သည် တန်ဖိုး 15 ခုပါရှိသော Python တွင် dataset တစ်ခုကို ဖန်တီးသည်ဆိုပါစို့။
#define array of data values
data = [7, 9, 10, 10, 12, 14, 15, 16, 16, 17, 19, 20, 21, 21, 23]
ပျမ်းမျှတန်ဖိုးအတွက် 95% bootstrap ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။
from scipy. stats import bootstrap
import numpy as np
#convert array to sequence
data = (data,)
#calculate 95% bootstrapped confidence interval for median
bootstrap_ci = bootstrap(data, np. median , confidence_level= 0.95 ,
random_state= 1 , method=' percentile ')
#view 95% boostrapped confidence interval
print ( bootstrap_ci.confidence_interval )
ConfidenceInterval(low=10.0, high=20.0)
အလယ်အလတ်အတွက် 95% bootstrap ယုံကြည်မှုကြားကာလသည် [10.0၊ 20.0] ဖြစ်လာသည်။
ဤသည်မှာ boostrap() function သည် hood အောက်တွင် အမှန်တကယ် လုပ်ဆောင်ခဲ့သည် ။
- bootstrap() လုပ်ဆောင်ချက်သည် အစားထိုးခြင်းဖြင့် နမူနာ 9,999 ကိုထုတ်ပေးခဲ့သည်။ (မူရင်းမှာ 9999 ဖြစ်သော်လည်း၊ သင်သည် ဤနံပါတ်ကိုပြောင်းရန် n_resamples အငြင်းအခုံကို အသုံးပြုနိုင်သည်။)
- bootstrap နမူနာတစ်ခုစီအတွက် ပျမ်းမျှအား တွက်ချက်ထားသည်။
- နမူနာတစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို အငယ်ဆုံးမှ အကြီးဆုံးသို့ စီစဥ်ထားပြီး 2.5% ရာခိုင်နှုန်းရှိ ပျမ်းမျှတန်ဖိုးနှင့် 97.5% ရာခိုင်နှုန်းကို 95% ယုံကြည်မှုကြားကာလ၏ အောက်နှင့်အထက် ကန့်သတ်ချက်များကို တည်ဆောက်ရန်အတွက် အသုံးပြုခဲ့သည်။ %
စာရင်းအင်းအားလုံးနီးပါးအတွက် bootstrap ယုံကြည်မှုကြားကာလကို တွက်ချက်နိုင်သည်ကို သတိပြုပါ။
ဥပမာအားဖြင့်၊ စံသွေဖည်မှုအတွက် 95% ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန်အတွက် bootstrap() လုပ်ဆောင်ချက်တွင် np.median ကို np.std ဖြင့် အစားထိုးနိုင်ပါသည်။
from scipy. stats import bootstrap
import numpy as np
#convert array to sequence
data = (data,)
#calculate 95% bootstrapped confidence interval for median
bootstrap_ci = bootstrap(data, np. std , confidence_level= 0.95 ,
random_state= 1 , method=' percentile ')
#view 95% boostrapped confidence interval
print ( bootstrap_ci.confidence_interval )
ConfidenceInterval(low=3.3199732261303283, high=5.66478399066117)
စံသွေဖည်မှုအတွက် 95% bootstrap ယုံကြည်မှုကြားကာလသည် [3.32၊ 5.67] ဖြစ်လာသည်။
မှတ်ချက် – ဤနမူနာများအတွက်၊ ကျွန်ုပ်တို့သည် 95% ယုံကြည်မှုကြားကာလများကို ဖန်တီးရန် ရွေးချယ်သော်လည်း၊ သင်သည် မတူညီသော အရွယ်အစားတစ်ခု၏ ယုံကြည်မှုကြားကာလကို တည်ဆောက်ရန်အတွက် trust_level အငြင်းအခုံတန်ဖိုးကို ပြောင်းလဲနိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အခြားစာရင်းအင်းဆော့ဖ်ဝဲတွင် bootstrap လုပ်နည်းကို ရှင်းပြသည်-