डिक्सन का क्यू परीक्षण: परिभाषा + उदाहरण


डिक्सन का क्यू टेस्ट , जिसे अक्सर क्यू टेस्ट कहा जाता है, एक सांख्यिकीय परीक्षण है जिसका उपयोग डेटा सेट में आउटलेर्स का पता लगाने के लिए किया जाता है।

Q परीक्षण आँकड़ा है:

क्यू = |एक्स एक्सबी | /आर

जहां x a संदिग्ध बाहरी है, x b x a का निकटतम डेटा बिंदु है, और R डेटासेट की सीमा है। अधिकांश मामलों में, x a डेटा सेट का अधिकतम मान है, लेकिन यह न्यूनतम मान भी हो सकता है।

यह ध्यान रखना महत्वपूर्ण है कि क्यू परीक्षण आमतौर पर छोटे डेटा सेट पर किया जाता है और यह मानता है कि डेटा सामान्य रूप से वितरित किया जाता है। यह भी ध्यान रखना महत्वपूर्ण है कि क्यू परीक्षण किसी दिए गए डेटा सेट के लिए केवल एक बार किया जाना चाहिए।

डिक्सन क्यू टेस्ट हाथ से कैसे करें

मान लीजिए हमारे पास निम्नलिखित डेटा सेट है:

1, 3, 5, 7, 8, 9, 13, 25

हम यह निर्धारित करने के लिए डिक्सन के क्यू परीक्षण को मैन्युअल रूप से निष्पादित करने के लिए मानक पांच-चरणीय परिकल्पना परीक्षण प्रक्रिया का पालन कर सकते हैं कि इस डेटा सेट में अधिकतम मूल्य एक बाहरी है या नहीं:

चरण 1. परिकल्पनाएँ बताएं।

शून्य परिकल्पना (H0): अधिकतम कोई बाह्य नहीं है।

वैकल्पिक परिकल्पना: (हा): अधिकतम एक बाह्य है

चरण 2. उपयोग करने के लिए एक महत्व स्तर निर्धारित करें।

सामान्य विकल्प 0.1, 0.05 और 0.01 हैं। इस उदाहरण के लिए हम 0.05 के महत्व स्तर का उपयोग करेंगे।

चरण 3. परीक्षण आँकड़ा खोजें।

क्यू = |एक्स एक्सबी | /आर

इस मामले में, हमारा अधिकतम मान x a = 25 है, हमारा अगला निकटतम मान x b = 13 है, और हमारी सीमा R = 25 – 1 = 24 है।

इस प्रकार, Q = |25 – 13| / 24 = 0.5 .

फिर हम इस परीक्षण आँकड़े की तुलना महत्वपूर्ण क्यू परीक्षण मानों से कर सकते हैं, जो विभिन्न नमूना आकार (एन) और आत्मविश्वास के स्तर के लिए नीचे दिखाए गए हैं:

n 90% 95% 99%
3 0.941 0.970 0.994
4 0.765 0.829 0.926
5 0.642 0.710 0.821
6 0.560 0.625 0.740
7 0.507 0.568 0.680
8 0.468 0.526 0.634
9 0.437 0.493 0.598
10 0.412 0.466 0.568
11 0.392 0.444 0.542
12 0.376 0.426 0.522
13 0.361 0.410 0.503
14 0.349 0.396 0.488
15 0.338 0.384 0.475
16 0.329 0.374 0.463
17 0.320 0.365 0.452
18 0.313 0.356 0.442
19 0.306 0.349 0.433
20 0.300 0.342 0.425
21 0.295 0.337 0.418
22 0.290 0.331 0.411
23 0.285 0.326 0.404
24 0.281 0.321 0.399
25 0.277 0.317 0.393
26 0.273 0.312 0.388
27 0.269 0.308 0.384
28 0.266 0.305 0.380
29 0.263 0.301 0.376
30 0.260 0.290 0.372

8 के नमूने और 95% के आत्मविश्वास स्तर के लिए महत्वपूर्ण मान 0.526 है।

चरण 4. शून्य परिकल्पना को अस्वीकार करें या अस्वीकार न करें।

चूँकि हमारा परीक्षण आँकड़ा Q (0.5) महत्वपूर्ण मान (0.526) से कम है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं।

चरण 5. परिणामों की व्याख्या करें।

चूँकि हम शून्य परिकल्पना को अस्वीकार करने में विफल रहे, इसलिए हम यह निष्कर्ष निकालते हैं कि इस डेटासेट में 25 का अधिकतम मान कोई बाहरी नहीं है।

आर में डिक्सन क्यू परीक्षण कैसे करें

R में समान डेटासेट पर डिक्सन का Q टेस्ट करने के लिए, हम आउटलेर्स लाइब्रेरी से dixon.test() फ़ंक्शन का उपयोग कर सकते हैं, जो निम्नलिखित सिंटैक्स का उपयोग करता है:

dixon.test(डेटा, , प्रकार = 10, विपरीत = गलत)

  • डेटा: डेटा मानों का एक संख्यात्मक वेक्टर
  • प्रकार: Q सांख्यिकीय परीक्षण करने के लिए उपयोग किए जाने वाले सूत्र का प्रकार। पहले वर्णित सूत्र का उपयोग करने के लिए 10 पर सेट करें।
  • विपरीत: यदि गलत है, तो परीक्षण यह निर्धारित करता है कि अधिकतम मान बाहरी है या नहीं। यदि सत्य है, तो परीक्षण यह निर्धारित करता है कि न्यूनतम मान बाहरी है या नहीं। यह डिफ़ॉल्ट रूप से गलत है.

ध्यान दें : dixon.test() के लिए संपूर्ण दस्तावेज़ यहां पाएं।

निम्नलिखित कोड दर्शाता है कि डिक्सन का क्यू परीक्षण यह निर्धारित करने के लिए कैसे किया जाए कि डेटा सेट में अधिकतम मान बाहरी है या नहीं।

 #load the outliers library
library(outliers)

#create data
data <- c(1, 3, 5, 7, 8, 9, 13, 25)

#conduct Dixon's Q Test
dixon.test(data, type = 10)

# Dixon test for outliers
#
#data:data
#Q = 0.5, p-value = 0.06913
#alternative hypothesis: highest value 25 is an outlier

परिणाम से, हम देख सकते हैं कि परीक्षण आँकड़ा Q = 0.5 है और संबंधित पी-मान 0.06913 है। इस प्रकार, हम 0.05 महत्व स्तर पर शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं और निष्कर्ष निकालते हैं कि 25 एक बाह्य नहीं है। यह हमारे द्वारा मैन्युअल रूप से प्राप्त परिणाम से मेल खाता है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *