आर में क्रैमर-वॉन मिज़ टेस्ट कैसे करें (उदाहरण के साथ)


क्रैमर-वॉन मिज़ परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि कोई नमूना सामान्य वितरण से आता है या नहीं।

इस प्रकार का परीक्षण यह निर्धारित करने के लिए उपयोगी है कि दिया गया डेटा सेट सामान्य वितरण से आता है या नहीं, जो कि प्रतिगमन , एनोवा , टी-परीक्षण और कई अन्य सहित कई सांख्यिकीय परीक्षणों में आमतौर पर इस्तेमाल की जाने वाली धारणा है। ‘अन्य।

हम R में goftest पैकेज से cvm.test() फ़ंक्शन का उपयोग करके आसानी से Cramer-Von Mises परीक्षण कर सकते हैं।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: सामान्य डेटा पर क्रैमर-वॉन मिज़ परीक्षण

निम्नलिखित कोड दिखाता है कि नमूना आकार n=100 वाले डेटासेट पर क्रैमर-वॉन मिज़ परीक्षण कैसे करें:

 library (goftest)

#make this example reproducible
set. seeds (0)

#create dataset of 100 random values generated from a normal distribution
data <- rnorm(100)

#perform Cramer-Von Mises test for normality
cvm. test (data, ' pnorm ')

	Cramer-von Mises test of goodness-of-fit
	Null hypothesis: Normal distribution
	Parameters assumed to be fixed

data:data
omega2 = 0.078666, p-value = 0.7007

परीक्षण का पी-मान 0.7007 निकला।

चूँकि यह मान 0.05 से कम नहीं है, हम मान सकते हैं कि नमूना डेटा सामान्य रूप से वितरित आबादी से आता है।

यह परिणाम आश्चर्यजनक नहीं होना चाहिए क्योंकि हमने rnorm() फ़ंक्शन का उपयोग करके नमूना डेटा तैयार किया है, जो मानक सामान्य वितरण से यादृच्छिक मान उत्पन्न करता है।

संबंधित: R में dnorm, pnorm, qnorm और rnorm के लिए एक गाइड

हम यह सत्यापित करने के लिए एक हिस्टोग्राम भी बना सकते हैं कि नमूना डेटा सामान्य रूप से वितरित किया गया है:

 hist(data, col=' steelblue ') 

आर में सामान्यता के लिए शापिरो-विल्क परीक्षण

हम देख सकते हैं कि वितरण काफी घंटी के आकार का है और वितरण के केंद्र में एक शिखर है, जो सामान्य रूप से वितरित डेटा का विशिष्ट है।

उदाहरण 2: गैर-सामान्य डेटा पर क्रैमर-वॉन मिज़ परीक्षण

निम्नलिखित कोड दिखाता है कि 100 के नमूना आकार वाले डेटासेट पर क्रैमर-वॉन मिज़ परीक्षण कैसे करें जिसमें मान पॉइसन वितरण से यादृच्छिक रूप से उत्पन्न होते हैं:

 library (goftest)

#make this example reproducible
set. seeds (0)

#create dataset of 100 random values generated from a Poisson distribution
data <- rpois(n=100, lambda=3)

#perform Cramer-Von Mises test for normality
cvm. test (data, ' pnorm ')

	Cramer-von Mises test of goodness-of-fit
	Null hypothesis: Normal distribution
	Parameters assumed to be fixed

data:data
omega2 = 27.96, p-value < 2.2e-16

परीक्षण का पी-वैल्यू बेहद कम निकला।

चूँकि यह मान 0.05 से कम है, हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि नमूना डेटा सामान्य रूप से वितरित आबादी से नहीं आता है।

यह परिणाम आश्चर्यजनक नहीं होना चाहिए क्योंकि हमने rpois() फ़ंक्शन का उपयोग करके नमूना डेटा तैयार किया है, जो पॉइसन वितरण से यादृच्छिक मान उत्पन्न करता है।

संबंधित: R में dpois, ppois, qpois और rpois के लिए एक मार्गदर्शिका

हम यह देखने के लिए एक हिस्टोग्राम भी तैयार कर सकते हैं कि नमूना डेटा सामान्य रूप से वितरित नहीं है:

 hist(data, col=' coral2 ') 

आर में शापिरो-विल्क परीक्षण हिस्टोग्राम

हम देख सकते हैं कि वितरण दाएं-तिरछा है और इसमें सामान्य वितरण से जुड़ा विशिष्ट “घंटी आकार” नहीं है।

इस प्रकार, हमारा हिस्टोग्राम क्रैमर-वॉन मिज़ परीक्षण के परिणामों से मेल खाता है और पुष्टि करता है कि हमारा नमूना डेटा सामान्य वितरण से नहीं आता है।

गैर-सामान्य डेटा का क्या करें

यदि कोई दिया गया डेटा सेट सामान्य रूप से वितरित नहीं है , तो हम इसे अधिक सामान्य बनाने के लिए अक्सर निम्नलिखित परिवर्तनों में से एक कर सकते हैं:

1. लॉग परिवर्तन: प्रतिक्रिया चर को y से log(y) में बदलें।

2. वर्गमूल परिवर्तन: प्रतिक्रिया चर को y से √y में बदलें।

3. घनमूल परिवर्तन: प्रतिक्रिया चर को y से y 1/3 में बदलें।

इन परिवर्तनों को निष्पादित करके, प्रतिक्रिया चर आम तौर पर सामान्य वितरण का अनुमान लगाता है।

इन परिवर्तनों को व्यवहार में कैसे लाया जाए यह देखने के लिए इस ट्यूटोरियल का संदर्भ लें।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्यता परीक्षण कैसे करें:

आर में शापिरो-विल्क परीक्षण कैसे करें
आर में एंडरसन-डार्लिंग परीक्षण कैसे करें
आर में कोलमोगोरोव-स्मिरनोव परीक्षण कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *