Python တွင် qq plot ဖန်တီးနည်း


“ quantile-quantile” ၏ အတိုကောက်ဖြစ်သော QQ ကွက်ကွက် တစ်ခုအား သီအိုရီအရ ဖြန့်ဝေမှုမှ ဒေတာအတွဲတစ်ခု ဖြစ်နိုင်ချေ ရှိမရှိ အကဲဖြတ်ရန် မကြာခဏ အသုံးပြုပါသည်။

ကိစ္စအများစုတွင်၊ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှု နောက်သို့လိုက်ခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်ရန် ဤကြံစည်မှုအမျိုးအစားကို အသုံးပြုသည်။

ဤသင်ခန်းစာသည် Python ရှိ ဒေတာအတွဲတစ်ခုအတွက် QQ ကွက်ကွက်ဖန်တီးနည်းကို ရှင်းပြထားသည်။

ဥပမာ- Python တွင် QQ ကြံစည်မှု

ကျွန်ုပ်တို့တွင် တန်ဖိုး 100 ၏ အောက်ပါဒေတာအစုရှိသည်ဆိုပါစို့။

 import numpy as np

#create dataset with 100 values that follows a normal distribution
np.random.seed(0)
data = np.random.normal(0,1, 1000)

#view first 10 values
data[:10] 

array([ 1.76405235, 0.40015721, 0.97873798, 2.2408932 , 1.86755799,
       -0.97727788, 0.95008842, -0.15135721, -0.10321885, 0.4105985 ])

ဤဒေတာအတွဲအတွက် QQ ကွက်ကွက်ဖန်တီးရန်၊ ကျွန်ုပ်တို့သည် statsmodels စာကြည့်တိုက်မှ qqplot() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 import statsmodels.api as sm
import matplotlib.pyplot as plt

#create QQ plot with 45-degree line added to plot
fig = sm.qqplot(data, line='45')
plt.show()

Python တွင် QQ Plot

QQ ကွက်ကွက်တစ်ခုတွင်၊ x-axis သည် သီအိုရီဆိုင်ရာ ပမာဏများကို ပြသသည်။ ဆိုလိုသည်မှာ ၎င်းသည် သင်၏ ဒေတာအမှန်ကို မပြဘဲ ပုံမှန်အတိုင်း ဖြန့်ဝေပါက သင့်ဒေတာသည် မည်သည့်နေရာတွင် ရှိမည်ကို ကိုယ်စားပြုသည်။

Y ဝင်ရိုးသည် သင်၏ လက်ရှိဒေတာကို ပြသသည်။ ဆိုလိုသည်မှာ ဒေတာတန်ဖိုးများသည် 45 ဒီဂရီထောင့်တွင် အကြမ်းဖျင်းဖြောင့်မျဉ်းအတိုင်း လိုက်နာပါက ဒေတာကို ပုံမှန်အားဖြင့် ဖြန့်ဝေပါသည်။

ဒေတာတန်ဖိုးများသည် 45 ဒီဂရီကို အနီးကပ်လိုက်နာလေ့ရှိကြောင်း အထက်ဖော်ပြပါ ကျွန်ုပ်တို့၏ QQ ကွက်တွင် ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ဆိုလိုသည်မှာ ဒေတာသည် ပုံမှန်ဖြန့်ဝေနိုင်ဖွယ်ရှိသည်။ numpy.random.normal() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာတန်ဖိုး 100 ကို ထုတ်ပေးသည့်အတွက် အံ့သြစရာမဖြစ်သင့်ပါ။

ယင်းအစား၊ ကျွန်ုပ်တို့သည် 100 တစ်ပြေးညီ ဖြန့်ဝေထားသော တန်ဖိုးများ ဒေတာအတွဲတစ်ခုကို ထုတ်ပေးပြီး ထိုဒေတာအတွဲအတွက် QQ ကွက်ကွက်တစ်ခုကို ဖန်တီးခဲ့ပါက စဉ်းစားကြည့်ပါ-

 #create dataset of 100 uniformly distributed values
data = np.random.uniform(0,1, 1000)

#generate QQ plot for the dataset
fig = sm.qqplot(data, line='45')
plt.show()

Q-Q သည် matplotlib ကို အသုံးပြု၍ Python တွင် မျဉ်းဖြောင့်ဖြင့် ကြံစည်မှု

ဒေတာတန်ဖိုးများသည် 45 ဒီဂရီ အနီရောင်မျဉ်းကို လိုက်နာခြင်းမရှိကြောင်း ရှင်းရှင်းလင်းလင်းသိရပြီး ၎င်းတို့သည် ပုံမှန်ဖြန့်ဖြူးမှုကို မလိုက်နာကြောင်း ညွှန်ပြသည်။

QQ Plots တွင် မှတ်စုများ

QQ မြေကွက်များအကြောင်း အောက်ပါမှတ်ချက်များကို မှတ်သားထားပါ။

  • QQ ကြံစည်မှုတစ်ခုသည် တရားဝင်စာရင်းအင်းစမ်းသပ်မှုမဟုတ်သော်လည်း၊ ၎င်းသည် ဒေတာအစုံကို ပုံမှန်ဖြန့်ဝေခြင်းရှိ၊ မရှိ စစ်ဆေးရန် ရိုးရှင်းသောနည်းလမ်းကို ပံ့ပိုးပေးပါသည်။
  • အသုံးနည်းပြီး အသုံးနည်းသော ဖြန့်ဝေမှု၏အမြီးတွင် ကျနေသည့် ဒေတာတန်ဖိုးများကို ခွဲခြမ်းစိတ်ဖြာရန်အတွက် အသုံးနည်းသော PP ကွက်များနှင့် QQ ကွက်များကို မရောထွေးမိစေရန် သတိထားပါ။

နောက်ထပ် Python သင်ခန်းစာများကို ဤနေရာတွင် ရှာနိုင်သည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်