R တွင် anderson-darling စမ်းသပ်မှုပြုလုပ်နည်း


Anderson-Darling test သည် သင့်ဒေတာသည် သတ်မှတ်ထားသော ဖြန့်ဝေမှုတစ်ခုနှင့် ကိုက်ညီမှု မည်မျှ ကောင်းမွန်ကြောင်း တိုင်းတာသည့် ကောင်းမွန်သော စမ်းသပ်မှုတစ်ခုဖြစ်သည်။ သင့်ဒေတာသည် ပုံမှန်ဖြန့်ဝေမှု နောက်သို့လိုက်ခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်ရန် ဤစမ်းသပ်မှုကို အများဆုံးအသုံးပြုပါသည်။

ဤစမ်းသပ်မှုအမျိုးအစားသည် ဆုတ်ယုတ်ခြင်း၊ ANOVA၊ t-tests နှင့် အခြားများစွာသော ကိန်းဂဏန်းစစ်ဆေးမှုများစွာတွင် အသုံးများသော ယူဆချက်ဖြစ်သည့် ပုံမှန်အခြေအနေစမ်းသပ်ခြင်းအတွက် အသုံးဝင်သည်။

ဥပမာ- R in Anderson-Darling test

R တွင် Anderson-Darling စမ်းသပ်မှုပြုလုပ်ရန်၊ ကျွန်ုပ်တို့သည် nortest စာကြည့်တိုက်ရှိ ad.test() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

အောက်ပါကုဒ်သည် တန်ဖိုး 100 ၏ vector သည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လိုက်နာခြင်း ရှိ၊ မရှိ စမ်းသပ်ရန် AD test ကို မည်သို့လုပ်ဆောင်ရမည်ကို ဖော်ပြသည်-

 #install (if not already installed) and load nortest library
install.packages('nortest')
library(nortest)

#make this example reproducible
set.seed(1)

#defined vector of 100 values that are normally distributed
x <- rnorm(100, 0, 1)

#conduct Anderson-Darling Test to test for normality
ad.test(x)

# Anderson-Darling normality test
#
#data:x
#A = 0.16021, p-value = 0.9471

ဤစမ်းသပ်မှုသည် တန်ဖိုးနှစ်ခုကို ပြန်ပေးသည်-

A : စမ်းသပ်စာရင်းအင်း။

p-value : စမ်းသပ်စာရင်းအင်း၏ သက်ဆိုင်ရာ p-တန်ဖိုး။

AD test ၏ null hypothesis မှာ data သည် ပုံမှန် ဖြန့်ဝေမှု နောက်ဆက်တွဲ ဖြစ်သည် ။ ထို့ကြောင့်၊ စာမေးပွဲအတွက် ကျွန်ုပ်တို့၏ p-value သည် ကျွန်ုပ်တို့၏ အရေးပါမှုအဆင့်ထက် နည်းနေပါက (အများအားဖြင့် ရွေးချယ်မှုများမှာ 0.10၊ 0.05၊ နှင့် 0.01)၊ ထို့နောက် null hypothesis ကို ငြင်းပယ်နိုင်ပြီး ကျွန်ုပ်တို့၏ဒေတာများ မလိုက်နာကြောင်း အခိုင်အမာသက်သေထူနိုင်သည် ဟု ကောက်ချက်ချနိုင်သည်။ ပုံမှန် လမ်းကြောင်းတစ်ခု။ ဖြန့်ဖြူးခြင်း။

ဤကိစ္စတွင်၊ ကျွန်ုပ်တို့၏ p-တန်ဖိုးသည် 0.9471 ဖြစ်သည်။ ဤနံပါတ်သည် ကျွန်ုပ်တို့၏ အရေးပါမှုအဆင့် (၀.၀၅) အောက်တွင် မရှိသောကြောင့်၊ ကျွန်ုပ်တို့တွင် null hypothesis ကို ငြင်းပယ်ရန် လုံလောက်သော အထောက်အထားမရှိပါ။ ကျွန်ုပ်တို့၏ဒေတာသည် rnorm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သော တန်ဖိုး 100 များကို rnorm() လုပ်ဆောင်ချက်ဖြင့် rnorm() လုပ်ဆောင်ချက်ဖြင့် 1 စံသွေဖည်မှုဖြင့် ထုတ်ပေးသည်ဟု ကျွန်ုပ်တို့၏ဒေတာသည် သာမာန်ဖြန့်ဝေမှုနောက်သို့လိုက်သည်ဟုဆိုခြင်းသည် စိတ်ချရပါသည်။

ဆက်စပ်- R တွင် dnorm၊ pnorm၊ qnorm နှင့် rnorm လမ်းညွှန်

ယင်းအစား၊ ကျွန်ုပ်တို့သည် 0 နှင့် 1 အကြား တူညီသောဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်သော တန်ဖိုး 100 ၏ vector တစ်ခုကို ထုတ်ပေးသည်ဆိုပါစို့။ ဤဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲရှိမရှိကြည့်ရှုရန် AD စမ်းသပ်မှုကို ထပ်မံလုပ်ဆောင်နိုင်သည်-

 #make this example reproducible
set.seed(1)

#defined vector of 100 values that are uniformly distributed
x <- runif(100, 0, 1)

#conduct Anderson-Darling Test to test for normality
ad.test(x)

# Anderson-Darling normality test
#
#data:x
#A = 1.1472, p-value = 0.005086

ကျွန်ုပ်တို့၏ စာမေးပွဲ စာရင်းအင်းသည် 1.1472 နှင့် သက်ဆိုင်သော p-value သည် 0.005086 နှင့် ညီမျှသည်။ ကျွန်ုပ်တို့၏ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်နိုင်ပြီး ဤဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုအား မလိုက်နာကြောင်းဆိုရန် လုံလောက်သော အထောက်အထားရှိကြောင်း ကျွန်ုပ်တို့တွင် ကောက်ချက်ချနိုင်ပါသည်။ ကျွန်ုပ်တို့၏ဒေတာသည် တစ်ပြေးညီဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်ကြောင်း ကျွန်ုပ်တို့သိထားသောကြောင့် ဤရလဒ်သည် ကျွန်ုပ်တို့မျှော်လင့်ထားသည့်ရလဒ်ဖြစ်သည်။

R ရှိ ဒေတာဘောင်တစ်ခု၏ ကော်လံတွင် Anderson-Darling စမ်းသပ်မှု ပြုလုပ်ခြင်း။

R ရှိ ဒေတာဘောင်တစ်ခု၏ သတ်မှတ်ထားသော ကော်လံတစ်ခုအတွက် AD စမ်းသပ်မှုကိုလည်း လုပ်ဆောင်နိုင်သည်။ ဥပမာအားဖြင့်၊ ထည့်သွင်းထားသော မျက်ဝန်း ဒေတာအတွဲကို သုံးသပ်ကြည့်ပါ-

 #view first six lines of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

Petal.Width variable ကို ပုံမှန်အတိုင်း ဖြန့်ဝေခြင်း ရှိ၊မရှိ သိလိုသည်ဆိုပါစို့။ တန်ဖိုးများခွဲဝေမှုကို မြင်သာစေရန်အတွက် ပထမဦးဆုံး histogram တစ်ခုကို ဖန်တီးနိုင်သည်-

 hist(iris$Petal.Width, col = 'steelblue', main = 'Distribution of Petal Widths',
     xlab = 'Petal Width')

ဒေတာကို ပုံမှန်ဖြန့်ဝေပုံမပေါ်ပါ။ ၎င်းကိုအတည်ပြုရန်၊ ကျွန်ုပ်တို့သည် ဒေတာကို ပုံမှန်ဖြန့်ဝေခြင်းရှိ၊ မရှိ တရားဝင်စမ်းသပ်ရန် AD စမ်းသပ်မှုကို လုပ်ဆောင်နိုင်သည်-

 #conduct Anderson-Darling Test to test for normality
ad.test(iris$Petal.Width)

# Anderson-Darling normality test
#
#data: iris$Petal.Width
#A = 5.1057, p-value = 1.125e-12

စမ်းသပ်မှု၏ p-value သည် 0.05 ထက်နည်းသောကြောင့် ကျွန်ုပ်တို့တွင် null hypothesis ကို ငြင်းပယ်ရန်နှင့် Petal.Width သည် ပုံမှန်ဖြန့်ဖြူးမှုကို မလိုက်နာကြောင်း ကောက်ချက်ချရန် လုံလောက်သောအထောက်အထားရှိပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်