R ဖြင့် qq plot တစ်ခုကို ဖန်တီးပြီး အဓိပါယ်ဖွင့်နည်း


QQ ကွက်ကွက် ၊ “ quantile-quantile” ၏ အတိုကောက်သည် ဒေတာအစုံသည် သီအိုရီအရ ဖြန့်ဝေမှုမှ ဖြစ်နိုင်ချေရှိမရှိ ဆုံးဖြတ်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် ကွက်အမျိုးအစားတစ်ခုဖြစ်သည်။

ကိန်းဂဏန်းစမ်းသပ်မှုများစွာသည် ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သည်ဟု ယူဆကြပြီး၊ ဤယူဆချက်နှင့်ကိုက်ညီမှုရှိမရှိ အကဲဖြတ်ရန် QQ ကွက်ကွက်ကို မကြာခဏအသုံးပြုသည်။

QQ ကြံစည်မှုတစ်ခုသည် တရားဝင်စာရင်းအင်းစမ်းသပ်မှုမဟုတ်သော်လည်း၊ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်သို့လိုက်ခြင်းရှိမရှိ အမြင်အာရုံစစ်ဆေးရန် ရိုးရှင်းသောနည်းလမ်းတစ်ခုဖြစ်ပြီး၊ အကယ်၍ ဤယူဆချက်အား မည်ကဲ့သို့ချိုးဖောက်ထားကြောင်းနှင့် ဤချိုးဖောက်မှု၏မူလအစတွင် မည်သည့်ဒေတာအချက်များ ဖြစ်နိုင်ချေရှိသနည်း။

တစ်ခုနှင့်တစ်ခု ပမာဏနှစ်ခုကို ကြံစည်ခြင်းဖြင့် QQ ကွက်ကွက်တစ်ခုကို ဖန်တီးနိုင်သည်။ အကယ်၍ ပမာဏနှစ်ခုလုံးသည် တူညီသောဖြန့်ဖြူးမှုမှလာပါက၊ ကွက်ကွက်ပေါ်ရှိ အမှတ်များသည် အကြမ်းဖျင်းအားဖြင့် ထောင့်ဖြတ်မျဉ်းဖြောင့်ပုံစံဖြစ်သင့်သည်။

QQ Plot နမူနာ

Quantiles များသည် ဒေတာ၏ အစိတ်အပိုင်းအချို့တွင်ရှိသော အောက်ဖော်ပြပါ ဒေတာအစုတစ်ခုရှိ အမှတ်များကို ကိုယ်စားပြုသည်။ ဥပမာအားဖြင့်၊ ပမာဏ 0.9 သည် ဒေတာ၏ 90% ကျသွားသည့် အောက်အမှတ်ကို ကိုယ်စားပြုသည်။ 0.5 quantile သည် data ၏ 50% သည် အောက်ဖော်ပြပါအချက်ကို ကိုယ်စားပြုသည် ။

QQ ကွက်များသည် သင့်ဒေတာနမူနာများ၏ အရေအတွက်ကို ခွဲခြားသတ်မှတ်ပြီး ၎င်းတို့အား သီအိုရီအရ ဖြန့်ဖြူးမှု၏ အရေအတွက်နှင့် နှိုင်းယှဉ်ပါသည်။ အခြေအနေအများစုတွင် ပုံမှန်ဖြန့်ဝေမှုကို အသုံးပြုသော်လည်း QQ ကွက်ကွက်ကို သီအိုရီပိုင်းအရ ဖြန့်ဖြူးမှုအတွက် အမှန်တကယ် ဖန်တီးနိုင်သည်။

QQ ကွက်ကွက်တစ်ခုတွင် ဒေတာအမှတ်များသည် ဖြောင့်ထောင့်ဖြတ်မျဉ်းတစ်လျှောက်တွင် ရှိနေပါက၊ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်နိုင်သည်။

R တွင် QQ ကွက်ကွက်ဖန်တီးနည်း

Built-in qqnorm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲရှိမရှိ စစ်ဆေးရန် QQ ကွက်ကွက်ကို အလွယ်တကူ ဖန်တီးနိုင်သည်။

ဥပမာအားဖြင့်၊ အောက်ပါကုဒ်သည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုး 100 ၏ vector တစ်ခုကို ထုတ်ပေးပြီး ၎င်းသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း အမှန်တကယ်ဖြစ်ကြောင်း အတည်ပြုရန် ထိုဒေတာအတွဲအတွက် QQ ကွက်ကွက်ကို ဖန်တီးပေးသည်-

 #make this example reproducible
set.seed(11)

#generate vector of 100 values that follows a normal distribution
data <- rnorm(100)

#create QQ plot to compare this dataset to a theoretical normal distribution
qqnorm(data)

ဒေတာသည် မျဉ်းဖြောင့်အတိုင်း လိုက်နေခြင်းရှိမရှိ သိမြင်ရန် ပိုမိုလွယ်ကူစေရန်၊ ကျွန်ုပ်တို့သည် qqline() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 #create QQ plot
qqnorm(data)

#add straight diagonal line to plot
qqline(data)

အမြီးနားရှိ ဒေတာအချက်များသည် မျဉ်းဖြောင့်အတိုင်း အတိအကျမလိုက်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သော်လည်း အများစုအတွက် ဤနမူနာဒေတာကို ပုံမှန်ဖြန့်ဝေနေပုံပေါ်သည် (ပုံမှန်ဖြန့်ဝေမှုတစ်ခုမှ ဒေတာကို R ကိုထုတ်ပေးရန် ကျွန်ုပ်တို့တောင်းဆိုထားသောကြောင့် ဖြစ်သင့်သည်။ ) )

ယင်းအစား၊ ဂမ်မာဖြန့်ဖြူးမှုနောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုး 100 ၏ vector ကိုထုတ်ပေးသည့် အောက်ပါကုဒ်ကို သုံးသပ်ပြီး ၎င်းသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်းဟုတ်မဟုတ် စစ်ဆေးရန်အတွက် ဤဒေတာအတွက် QQ ကွက်ကွက်ဖန်တီးပေးသည်-

 #make this example reproducible
set.seed(11)

#generate vector of 100 values that follows a gamma distribution
data <- rgamma(100, 1)

#create QQ plot to compare this dataset to a theoretical normal distribution
qqnorm(data)
qqline(data)

ဤ QQ ကွက်ကွက်တွင် မျဉ်းဖြောင့်မှ ရှင်းရှင်းလင်းလင်း သွေဖည်သွားသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပြီး၊ ဤဒေတာအစုသည် ပုံမှန်ဖြန့်ဝေမှုနောက်သို့ မလိုက်နိုင်ကြောင်း ညွှန်ပြပါသည်။

လွတ်လပ်မှု 5 ဒီဂရီရှိသော Chi-square ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုး 100 ၏ vector ကိုထုတ်ပေးသည့် အခြားကုဒ်အပိုင်းတစ်ခုကို သုံးသပ်ပြီး ၎င်းသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်းဟုတ်မဟုတ် စစ်ဆေးရန် ဤဒေတာအတွက် QQ ကွက်ကွက်ကို ဖန်တီးသည်-

 #make this example reproducible
set.seed(11)

#generate vector of 100 values that follows a Chi-Square distribution
data <- rchisq(100, 5)

#create QQ plot to compare this dataset to a theoretical normal distribution
qqnorm(data)
qqline(data)

ဤဒေတာအတွဲသည် အထူးသဖြင့် အမြီးများအနီးတွင် ပုံမှန်ဖြန့်ချီပုံမပေါ်ကြောင်း တစ်ဖန် ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည် ။

R တွင် QQ ကွက်ကွက်တစ်ခု၏ သာယာလှပမှုကို ပြောင်းလဲပါ။

ခေါင်းစဉ်၊ ဝင်ရိုးအညွှန်းများ၊ ဒေတာအမှတ်အရောင်များ၊ လိုင်းအရောင်နှင့် မျဉ်းအကျယ်အပါအဝင် R ရှိ QQ ကွက်ကွက်၏ အလှတရားအချို့ကို ကျွန်ုပ်တို့ ပြောင်းလဲနိုင်သည်။

အောက်ပါကုဒ်သည် ခေါင်းစဉ်များ၊ ဝင်ရိုးအညွှန်းများနှင့် ကွက်ကွက်အမှတ်များ၏ အရောင်ကို ပြောင်းလဲသည်-

 #make this example reproducible
set.seed(11)

#generate vector of 100 values that follows a normal distribution
data <- rnorm(100)

#create QQ plot
qqnorm(data, main = 'QQ Plot for Normality', xlab = 'Theoretical Dist',
       ylab = 'Sample dist', col = 'steelblue')

ထို့နောက် အောက်ပါကုဒ်သည် အနီရောင်အရောင်၊ မျဉ်းအကျယ် 2 (lwd = 2၊ ပုံသေသည် 1) နှင့် မျဉ်းတန်းမျဉ်း (lty = 2၊ ပုံသေ 1) ဖြင့် ကွက်လပ်သို့ ဖြောင့်တန်းသော ထောင့်ဖြတ်မျဉ်းကို ပေါင်းထည့်သည်။

 qqline(data, col = 'red', lwd = 2, lty = 2)

နည်းပညာမှတ်စုများ

QQ ကွက်ကွက်သည် ဒေတာအစုံသည် သီအိုရီဖြန့ ချီမှုနောက်သို့လိုက်ခြင်းရှိ၊ ဒေတာအတွဲတစ်ခုသည် သီးခြားဖြန့်ဝေမှုတစ်ခုသို့ လိုက်နာခြင်းရှိ၊ မရှိ တရားဝင်စမ်းသပ်ရန်အတွက်၊ အောက်ပါစမ်းသပ်မှုများကို လုပ်ဆောင်နိုင်သည် (သင်သည် သင်၏ဒေတာအတွဲကို ပုံမှန်ဖြန့်ဖြူးမှုတစ်ခုနှင့် နှိုင်းယှဉ်နေသည်ဟု ယူဆသည်)။

Anderson-Darling စမ်းသပ်မှု
Shapiro-Wilk စမ်းသပ်မှု
Kolmogorov-Smirnov စမ်းသပ်မှု

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်