Python တွင် bootstrapping လုပ်နည်း (ဥပမာနှင့်အတူ)


Bootstrapping သည် နမူနာ အရွယ်အစား သေးငယ်ပြီး အရင်းခံ ဖြန့်ဝေမှုကို မသိသောအခါ ကိန်းဂဏန်း တစ်ခုအတွက် ယုံကြည်မှုကြားကာလကို တည်ဆောက်ရန် အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။

bootstrapping အတွက် အခြေခံလုပ်ငန်းစဉ်မှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • ပေးထားသောဒေတာအစုံမှ အစားထိုးခြင်းဖြင့် k နမူနာများကို ပုံတူပွားယူပါ။
  • နမူနာတစ်ခုစီအတွက် အတိုးနှုန်းစာရင်းကို တွက်ချက်ပါ။
  • ၎င်းသည် ပေးထားသော ကိန်းဂဏန်းတစ်ခုအတွက် မတူညီသော ခန့်မှန်းချက်များကို ပေးသည်၊ ထို့နောက် ကိန်းဂဏန်းအတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် သင်အသုံးပြုနိုင်သည်။

Python တွင် bootstrap လုပ်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ SciPy စာကြည့်တိုက်မှ bootstrap လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- Python တွင် bootstrapping လုပ်ဆောင်ခြင်း။

ကျွန်ုပ်တို့သည် တန်ဖိုး 15 ခုပါရှိသော Python တွင် dataset တစ်ခုကို ဖန်တီးသည်ဆိုပါစို့။

 #define array of data values
data = [7, 9, 10, 10, 12, 14, 15, 16, 16, 17, 19, 20, 21, 21, 23]

ပျမ်းမျှတန်ဖိုးအတွက် 95% bootstrap ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

 from scipy. stats import bootstrap
import numpy as np

#convert array to sequence
data = (data,)

#calculate 95% bootstrapped confidence interval for median
bootstrap_ci = bootstrap(data, np. median , confidence_level= 0.95 ,
                         random_state= 1 , method=' percentile ')

#view 95% boostrapped confidence interval
print ( bootstrap_ci.confidence_interval )

ConfidenceInterval(low=10.0, high=20.0)

အလယ်အလတ်အတွက် 95% bootstrap ယုံကြည်မှုကြားကာလသည် [10.0၊ 20.0] ဖြစ်လာသည်။

ဤသည်မှာ boostrap() function သည် hood အောက်တွင် အမှန်တကယ် လုပ်ဆောင်ခဲ့သည် ။

  • bootstrap() လုပ်ဆောင်ချက်သည် အစားထိုးခြင်းဖြင့် နမူနာ 9,999 ကိုထုတ်ပေးခဲ့သည်။ (မူရင်းမှာ 9999 ဖြစ်သော်လည်း၊ သင်သည် ဤနံပါတ်ကိုပြောင်းရန် n_resamples အငြင်းအခုံကို အသုံးပြုနိုင်သည်။)
  • bootstrap နမူနာတစ်ခုစီအတွက် ပျမ်းမျှအား တွက်ချက်ထားသည်။
  • နမူနာတစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို အငယ်ဆုံးမှ အကြီးဆုံးသို့ စီစဥ်ထားပြီး 2.5% ရာခိုင်နှုန်းရှိ ပျမ်းမျှတန်ဖိုးနှင့် 97.5% ရာခိုင်နှုန်းကို 95% ယုံကြည်မှုကြားကာလ၏ အောက်နှင့်အထက် ကန့်သတ်ချက်များကို တည်ဆောက်ရန်အတွက် အသုံးပြုခဲ့သည်။ %

စာရင်းအင်းအားလုံးနီးပါးအတွက် bootstrap ယုံကြည်မှုကြားကာလကို တွက်ချက်နိုင်သည်ကို သတိပြုပါ။

ဥပမာအားဖြင့်၊ စံသွေဖည်မှုအတွက် 95% ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန်အတွက် bootstrap() လုပ်ဆောင်ချက်တွင် np.median ကို np.std ဖြင့် အစားထိုးနိုင်ပါသည်။

 from scipy. stats import bootstrap
import numpy as np

#convert array to sequence
data = (data,)

#calculate 95% bootstrapped confidence interval for median
bootstrap_ci = bootstrap(data, np. std , confidence_level= 0.95 ,
                         random_state= 1 , method=' percentile ')

#view 95% boostrapped confidence interval
print ( bootstrap_ci.confidence_interval )

ConfidenceInterval(low=3.3199732261303283, high=5.66478399066117)

စံသွေဖည်မှုအတွက် 95% bootstrap ယုံကြည်မှုကြားကာလသည် [3.32၊ 5.67] ဖြစ်လာသည်။

မှတ်ချက် – ဤနမူနာများအတွက်၊ ကျွန်ုပ်တို့သည် 95% ယုံကြည်မှုကြားကာလများကို ဖန်တီးရန် ရွေးချယ်သော်လည်း၊ သင်သည် မတူညီသော အရွယ်အစားတစ်ခု၏ ယုံကြည်မှုကြားကာလကို တည်ဆောက်ရန်အတွက် trust_level အငြင်းအခုံတန်ဖိုးကို ပြောင်းလဲနိုင်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အခြားစာရင်းအင်းဆော့ဖ်ဝဲတွင် bootstrap လုပ်နည်းကို ရှင်းပြသည်-

R တွင် bootstrap လုပ်နည်း
Excel တွင် bootstrap လုပ်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်