आर में एंडरसन-डार्लिंग परीक्षण कैसे करें
एंडरसन-डार्लिंग परीक्षण एक अच्छाई-की-फिट परीक्षण है जो मापता है कि आपका डेटा एक निर्दिष्ट वितरण में कितनी अच्छी तरह फिट बैठता है। इस परीक्षण का उपयोग अक्सर यह निर्धारित करने के लिए किया जाता है कि आपका डेटा सामान्य वितरण का पालन करता है या नहीं।
इस प्रकार का परीक्षण सामान्यता के परीक्षण के लिए उपयोगी है, जो कि प्रतिगमन, एनोवा, टी-परीक्षण और कई अन्य सहित कई सांख्यिकीय परीक्षणों में आमतौर पर इस्तेमाल की जाने वाली धारणा है।
उदाहरण: आर में एंडरसन-डार्लिंग परीक्षण
आर में एंडरसन-डार्लिंग परीक्षण करने के लिए, हम सबसे उत्तरी लाइब्रेरी में ad.test() फ़ंक्शन का उपयोग कर सकते हैं।
निम्नलिखित कोड दिखाता है कि 100 मानों का वेक्टर सामान्य वितरण का पालन करता है या नहीं, यह जांचने के लिए AD परीक्षण कैसे करें:
#install (if not already installed) and load nortest library install.packages('nortest') library(nortest) #make this example reproducible set.seed(1) #defined vector of 100 values that are normally distributed x <- rnorm(100, 0, 1) #conduct Anderson-Darling Test to test for normality ad.test(x) # Anderson-Darling normality test # #data:x #A = 0.16021, p-value = 0.9471
यह परीक्षण दो मान लौटाता है:
ए : परीक्षण आँकड़ा.
पी-वैल्यू : परीक्षण आँकड़े का संगत पी-वैल्यू।
एडी परीक्षण की शून्य परिकल्पना यह है कि डेटा सामान्य वितरण का अनुसरण करता है । इसलिए, यदि परीक्षण के लिए हमारा पी-वैल्यू हमारे महत्व स्तर से कम है (सामान्य विकल्प 0.10, 0.05 और 0.01 हैं), तो हम शून्य परिकल्पना को अस्वीकार कर सकते हैं और निष्कर्ष निकाल सकते हैं कि हमारे पास यह दावा करने के लिए पर्याप्त सबूत हैं कि हमारा डेटा इसका पालन नहीं करता है। एक सामान्य प्रक्षेपवक्र. वितरण।
इस मामले में, हमारा पी-वैल्यू 0.9471 है। चूँकि यह संख्या हमारे महत्व स्तर (जैसे 0.05) से नीचे नहीं है, हमारे पास शून्य परिकल्पना को अस्वीकार करने के लिए पर्याप्त सबूत नहीं हैं। यह कहना सुरक्षित है कि हमारा डेटा एक सामान्य वितरण का अनुसरण करता है, जो समझ में आता है कि हमने 100 मान उत्पन्न किए हैं जो आर में rnorm() फ़ंक्शन का उपयोग करके 0 के माध्य और 1 के मानक विचलन के साथ सामान्य वितरण का पालन करते हैं।
संबंधित: R में dnorm, pnorm, qnorm और rnorm के लिए एक गाइड
इसके बजाय, मान लीजिए कि हम 100 मानों का एक वेक्टर उत्पन्न करते हैं जो 0 और 1 के बीच एक समान वितरण का पालन करता है। हम यह देखने के लिए फिर से एडी परीक्षण चला सकते हैं कि क्या यह डेटा सामान्य वितरण का पालन करता है:
#make this example reproducible set.seed(1) #defined vector of 100 values that are uniformly distributed x <- runif(100, 0, 1) #conduct Anderson-Darling Test to test for normality ad.test(x) # Anderson-Darling normality test # #data:x #A = 1.1472, p-value = 0.005086
हमारा ए परीक्षण आँकड़ा 1.1472 के बराबर है और संबंधित पी-मान 0.005086 के बराबर है। चूँकि हमारा पी-वैल्यू 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार कर सकते हैं और निष्कर्ष निकाल सकते हैं कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि यह डेटा सामान्य वितरण का पालन नहीं करता है। यह वह परिणाम है जिसकी हमें अपेक्षा थी क्योंकि हम जानते हैं कि हमारा डेटा वास्तव में एक समान वितरण का अनुसरण करता है।
आर में डेटा फ्रेम के एक कॉलम पर एंडरसन-डार्लिंग परीक्षण करना
हम आर में डेटा फ्रेम के एक निर्दिष्ट कॉलम के लिए एडी परीक्षण भी कर सकते हैं। उदाहरण के लिए, एम्बेडेड आईरिस डेटासेट पर विचार करें:
#view first six lines of iris dataset
head(iris)
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa
मान लीजिए कि हम जानना चाहते हैं कि पेटल.विड्थ वेरिएबल सामान्य रूप से वितरित है या नहीं। मूल्यों के वितरण की कल्पना करने के लिए हम पहले एक हिस्टोग्राम बना सकते हैं:
hist(iris$Petal.Width, col = 'steelblue', main = 'Distribution of Petal Widths', xlab = 'Petal Width')
ऐसा प्रतीत होता है कि डेटा सामान्य रूप से वितरित नहीं किया गया है। इसकी पुष्टि करने के लिए, हम औपचारिक रूप से यह जांचने के लिए AD परीक्षण कर सकते हैं कि डेटा सामान्य रूप से वितरित है या नहीं:
#conduct Anderson-Darling Test to test for normality
ad.test(iris$Petal.Width)
# Anderson-Darling normality test
#
#data: iris$Petal.Width
#A = 5.1057, p-value = 1.125e-12
परीक्षण का पी-मान 0.05 से कम है, इसलिए हमारे पास शून्य परिकल्पना को अस्वीकार करने और यह निष्कर्ष निकालने के लिए पर्याप्त सबूत हैं कि पेटल.विड्थ सामान्य वितरण का पालन नहीं करता है।