Python တွင် qq plot ဖန်တီးနည်း
“ quantile-quantile” ၏ အတိုကောက်ဖြစ်သော QQ ကွက်ကွက် တစ်ခုအား သီအိုရီအရ ဖြန့်ဝေမှုမှ ဒေတာအတွဲတစ်ခု ဖြစ်နိုင်ချေ ရှိမရှိ အကဲဖြတ်ရန် မကြာခဏ အသုံးပြုပါသည်။
ကိစ္စအများစုတွင်၊ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှု နောက်သို့လိုက်ခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်ရန် ဤကြံစည်မှုအမျိုးအစားကို အသုံးပြုသည်။
ဤသင်ခန်းစာသည် Python ရှိ ဒေတာအတွဲတစ်ခုအတွက် QQ ကွက်ကွက်ဖန်တီးနည်းကို ရှင်းပြထားသည်။
ဥပမာ- Python တွင် QQ ကြံစည်မှု
ကျွန်ုပ်တို့တွင် တန်ဖိုး 100 ၏ အောက်ပါဒေတာအစုရှိသည်ဆိုပါစို့။
import numpy as np #create dataset with 100 values that follows a normal distribution np.random.seed(0) data = np.random.normal(0,1, 1000) #view first 10 values data[:10] array([ 1.76405235, 0.40015721, 0.97873798, 2.2408932 , 1.86755799, -0.97727788, 0.95008842, -0.15135721, -0.10321885, 0.4105985 ])
ဤဒေတာအတွဲအတွက် QQ ကွက်ကွက်ဖန်တီးရန်၊ ကျွန်ုပ်တို့သည် statsmodels စာကြည့်တိုက်မှ qqplot() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
import statsmodels.api as sm import matplotlib.pyplot as plt #create QQ plot with 45-degree line added to plot fig = sm.qqplot(data, line='45') plt.show()
QQ ကွက်ကွက်တစ်ခုတွင်၊ x-axis သည် သီအိုရီဆိုင်ရာ ပမာဏများကို ပြသသည်။ ဆိုလိုသည်မှာ ၎င်းသည် သင်၏ ဒေတာအမှန်ကို မပြဘဲ ပုံမှန်အတိုင်း ဖြန့်ဝေပါက သင့်ဒေတာသည် မည်သည့်နေရာတွင် ရှိမည်ကို ကိုယ်စားပြုသည်။
Y ဝင်ရိုးသည် သင်၏ လက်ရှိဒေတာကို ပြသသည်။ ဆိုလိုသည်မှာ ဒေတာတန်ဖိုးများသည် 45 ဒီဂရီထောင့်တွင် အကြမ်းဖျင်းဖြောင့်မျဉ်းအတိုင်း လိုက်နာပါက ဒေတာကို ပုံမှန်အားဖြင့် ဖြန့်ဝေပါသည်။
ဒေတာတန်ဖိုးများသည် 45 ဒီဂရီကို အနီးကပ်လိုက်နာလေ့ရှိကြောင်း အထက်ဖော်ပြပါ ကျွန်ုပ်တို့၏ QQ ကွက်တွင် ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ဆိုလိုသည်မှာ ဒေတာသည် ပုံမှန်ဖြန့်ဝေနိုင်ဖွယ်ရှိသည်။ numpy.random.normal() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာတန်ဖိုး 100 ကို ထုတ်ပေးသည့်အတွက် အံ့သြစရာမဖြစ်သင့်ပါ။
ယင်းအစား၊ ကျွန်ုပ်တို့သည် 100 တစ်ပြေးညီ ဖြန့်ဝေထားသော တန်ဖိုးများ ဒေတာအတွဲတစ်ခုကို ထုတ်ပေးပြီး ထိုဒေတာအတွဲအတွက် QQ ကွက်ကွက်တစ်ခုကို ဖန်တီးခဲ့ပါက စဉ်းစားကြည့်ပါ-
#create dataset of 100 uniformly distributed values data = np.random.uniform(0,1, 1000) #generate QQ plot for the dataset fig = sm.qqplot(data, line='45') plt.show()
ဒေတာတန်ဖိုးများသည် 45 ဒီဂရီ အနီရောင်မျဉ်းကို လိုက်နာခြင်းမရှိကြောင်း ရှင်းရှင်းလင်းလင်းသိရပြီး ၎င်းတို့သည် ပုံမှန်ဖြန့်ဖြူးမှုကို မလိုက်နာကြောင်း ညွှန်ပြသည်။
QQ Plots တွင် မှတ်စုများ
QQ မြေကွက်များအကြောင်း အောက်ပါမှတ်ချက်များကို မှတ်သားထားပါ။
- QQ ကြံစည်မှုတစ်ခုသည် တရားဝင်စာရင်းအင်းစမ်းသပ်မှုမဟုတ်သော်လည်း၊ ၎င်းသည် ဒေတာအစုံကို ပုံမှန်ဖြန့်ဝေခြင်းရှိ၊ မရှိ စစ်ဆေးရန် ရိုးရှင်းသောနည်းလမ်းကို ပံ့ပိုးပေးပါသည်။
- အသုံးနည်းပြီး အသုံးနည်းသော ဖြန့်ဝေမှု၏အမြီးတွင် ကျနေသည့် ဒေတာတန်ဖိုးများကို ခွဲခြမ်းစိတ်ဖြာရန်အတွက် အသုံးနည်းသော PP ကွက်များနှင့် QQ ကွက်များကို မရောထွေးမိစေရန် သတိထားပါ။
နောက်ထပ် Python သင်ခန်းစာများကို ဤနေရာတွင် ရှာနိုင်သည်။