R ဖြင့် qq plot တစ်ခုကို ဖန်တီးပြီး အဓိပါယ်ဖွင့်နည်း
QQ ကွက်ကွက် ၊ “ quantile-quantile” ၏ အတိုကောက်သည် ဒေတာအစုံသည် သီအိုရီအရ ဖြန့်ဝေမှုမှ ဖြစ်နိုင်ချေရှိမရှိ ဆုံးဖြတ်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် ကွက်အမျိုးအစားတစ်ခုဖြစ်သည်။
ကိန်းဂဏန်းစမ်းသပ်မှုများစွာသည် ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သည်ဟု ယူဆကြပြီး၊ ဤယူဆချက်နှင့်ကိုက်ညီမှုရှိမရှိ အကဲဖြတ်ရန် QQ ကွက်ကွက်ကို မကြာခဏအသုံးပြုသည်။
QQ ကြံစည်မှုတစ်ခုသည် တရားဝင်စာရင်းအင်းစမ်းသပ်မှုမဟုတ်သော်လည်း၊ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်သို့လိုက်ခြင်းရှိမရှိ အမြင်အာရုံစစ်ဆေးရန် ရိုးရှင်းသောနည်းလမ်းတစ်ခုဖြစ်ပြီး၊ အကယ်၍ ဤယူဆချက်အား မည်ကဲ့သို့ချိုးဖောက်ထားကြောင်းနှင့် ဤချိုးဖောက်မှု၏မူလအစတွင် မည်သည့်ဒေတာအချက်များ ဖြစ်နိုင်ချေရှိသနည်း။
တစ်ခုနှင့်တစ်ခု ပမာဏနှစ်ခုကို ကြံစည်ခြင်းဖြင့် QQ ကွက်ကွက်တစ်ခုကို ဖန်တီးနိုင်သည်။ အကယ်၍ ပမာဏနှစ်ခုလုံးသည် တူညီသောဖြန့်ဖြူးမှုမှလာပါက၊ ကွက်ကွက်ပေါ်ရှိ အမှတ်များသည် အကြမ်းဖျင်းအားဖြင့် ထောင့်ဖြတ်မျဉ်းဖြောင့်ပုံစံဖြစ်သင့်သည်။
Quantiles များသည် ဒေတာ၏ အစိတ်အပိုင်းအချို့တွင်ရှိသော အောက်ဖော်ပြပါ ဒေတာအစုတစ်ခုရှိ အမှတ်များကို ကိုယ်စားပြုသည်။ ဥပမာအားဖြင့်၊ ပမာဏ 0.9 သည် ဒေတာ၏ 90% ကျသွားသည့် အောက်အမှတ်ကို ကိုယ်စားပြုသည်။ 0.5 quantile သည် data ၏ 50% သည် အောက်ဖော်ပြပါအချက်ကို ကိုယ်စားပြုသည် ။
QQ ကွက်များသည် သင့်ဒေတာနမူနာများ၏ အရေအတွက်ကို ခွဲခြားသတ်မှတ်ပြီး ၎င်းတို့အား သီအိုရီအရ ဖြန့်ဖြူးမှု၏ အရေအတွက်နှင့် နှိုင်းယှဉ်ပါသည်။ အခြေအနေအများစုတွင် ပုံမှန်ဖြန့်ဝေမှုကို အသုံးပြုသော်လည်း QQ ကွက်ကွက်ကို သီအိုရီပိုင်းအရ ဖြန့်ဖြူးမှုအတွက် အမှန်တကယ် ဖန်တီးနိုင်သည်။
QQ ကွက်ကွက်တစ်ခုတွင် ဒေတာအမှတ်များသည် ဖြောင့်ထောင့်ဖြတ်မျဉ်းတစ်လျှောက်တွင် ရှိနေပါက၊ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်နိုင်သည်။
R တွင် QQ ကွက်ကွက်ဖန်တီးနည်း
Built-in qqnorm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲရှိမရှိ စစ်ဆေးရန် QQ ကွက်ကွက်ကို အလွယ်တကူ ဖန်တီးနိုင်သည်။
ဥပမာအားဖြင့်၊ အောက်ပါကုဒ်သည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုး 100 ၏ vector တစ်ခုကို ထုတ်ပေးပြီး ၎င်းသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း အမှန်တကယ်ဖြစ်ကြောင်း အတည်ပြုရန် ထိုဒေတာအတွဲအတွက် QQ ကွက်ကွက်ကို ဖန်တီးပေးသည်-
#make this example reproducible set.seed(11) #generate vector of 100 values that follows a normal distribution data <- rnorm(100) #create QQ plot to compare this dataset to a theoretical normal distribution qqnorm(data)
ဒေတာသည် မျဉ်းဖြောင့်အတိုင်း လိုက်နေခြင်းရှိမရှိ သိမြင်ရန် ပိုမိုလွယ်ကူစေရန်၊ ကျွန်ုပ်တို့သည် qqline() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
#create QQ plot qqnorm(data) #add straight diagonal line to plot qqline(data)
အမြီးနားရှိ ဒေတာအချက်များသည် မျဉ်းဖြောင့်အတိုင်း အတိအကျမလိုက်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သော်လည်း အများစုအတွက် ဤနမူနာဒေတာကို ပုံမှန်ဖြန့်ဝေနေပုံပေါ်သည် (ပုံမှန်ဖြန့်ဝေမှုတစ်ခုမှ ဒေတာကို R ကိုထုတ်ပေးရန် ကျွန်ုပ်တို့တောင်းဆိုထားသောကြောင့် ဖြစ်သင့်သည်။ ) )
ယင်းအစား၊ ဂမ်မာဖြန့်ဖြူးမှုနောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုး 100 ၏ vector ကိုထုတ်ပေးသည့် အောက်ပါကုဒ်ကို သုံးသပ်ပြီး ၎င်းသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်းဟုတ်မဟုတ် စစ်ဆေးရန်အတွက် ဤဒေတာအတွက် QQ ကွက်ကွက်ဖန်တီးပေးသည်-
#make this example reproducible set.seed(11) #generate vector of 100 values that follows a gamma distribution data <- rgamma(100, 1) #create QQ plot to compare this dataset to a theoretical normal distribution qqnorm(data) qqline(data)
ဤ QQ ကွက်ကွက်တွင် မျဉ်းဖြောင့်မှ ရှင်းရှင်းလင်းလင်း သွေဖည်သွားသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပြီး၊ ဤဒေတာအစုသည် ပုံမှန်ဖြန့်ဝေမှုနောက်သို့ မလိုက်နိုင်ကြောင်း ညွှန်ပြပါသည်။
လွတ်လပ်မှု 5 ဒီဂရီရှိသော Chi-square ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သော ကျပန်းတန်ဖိုး 100 ၏ vector ကိုထုတ်ပေးသည့် အခြားကုဒ်အပိုင်းတစ်ခုကို သုံးသပ်ပြီး ၎င်းသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်းဟုတ်မဟုတ် စစ်ဆေးရန် ဤဒေတာအတွက် QQ ကွက်ကွက်ကို ဖန်တီးသည်-
#make this example reproducible set.seed(11) #generate vector of 100 values that follows a Chi-Square distribution data <- rchisq(100, 5) #create QQ plot to compare this dataset to a theoretical normal distribution qqnorm(data) qqline(data)
ဤဒေတာအတွဲသည် အထူးသဖြင့် အမြီးများအနီးတွင် ပုံမှန်ဖြန့်ချီပုံမပေါ်ကြောင်း တစ်ဖန် ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည် ။
R တွင် QQ ကွက်ကွက်တစ်ခု၏ သာယာလှပမှုကို ပြောင်းလဲပါ။
ခေါင်းစဉ်၊ ဝင်ရိုးအညွှန်းများ၊ ဒေတာအမှတ်အရောင်များ၊ လိုင်းအရောင်နှင့် မျဉ်းအကျယ်အပါအဝင် R ရှိ QQ ကွက်ကွက်၏ အလှတရားအချို့ကို ကျွန်ုပ်တို့ ပြောင်းလဲနိုင်သည်။
အောက်ပါကုဒ်သည် ခေါင်းစဉ်များ၊ ဝင်ရိုးအညွှန်းများနှင့် ကွက်ကွက်အမှတ်များ၏ အရောင်ကို ပြောင်းလဲသည်-
#make this example reproducible set.seed(11) #generate vector of 100 values that follows a normal distribution data <- rnorm(100) #create QQ plot qqnorm(data, main = 'QQ Plot for Normality', xlab = 'Theoretical Dist', ylab = 'Sample dist', col = 'steelblue')
ထို့နောက် အောက်ပါကုဒ်သည် အနီရောင်အရောင်၊ မျဉ်းအကျယ် 2 (lwd = 2၊ ပုံသေသည် 1) နှင့် မျဉ်းတန်းမျဉ်း (lty = 2၊ ပုံသေ 1) ဖြင့် ကွက်လပ်သို့ ဖြောင့်တန်းသော ထောင့်ဖြတ်မျဉ်းကို ပေါင်းထည့်သည်။
qqline(data, col = 'red', lwd = 2, lty = 2)
နည်းပညာမှတ်စုများ
QQ ကွက်ကွက်သည် ဒေတာအစုံသည် သီအိုရီဖြန့ ် ချီမှုနောက်သို့လိုက်ခြင်းရှိ၊ ဒေတာအတွဲတစ်ခုသည် သီးခြားဖြန့်ဝေမှုတစ်ခုသို့ လိုက်နာခြင်းရှိ၊ မရှိ တရားဝင်စမ်းသပ်ရန်အတွက်၊ အောက်ပါစမ်းသပ်မှုများကို လုပ်ဆောင်နိုင်သည် (သင်သည် သင်၏ဒေတာအတွဲကို ပုံမှန်ဖြန့်ဖြူးမှုတစ်ခုနှင့် နှိုင်းယှဉ်နေသည်ဟု ယူဆသည်)။
Anderson-Darling စမ်းသပ်မှု
Shapiro-Wilk စမ်းသပ်မှု
Kolmogorov-Smirnov စမ်းသပ်မှု