संपूर्ण मार्गदर्शिका: आर में परिकल्पना परीक्षण


परिकल्पना परीक्षण एक औपचारिक सांख्यिकीय परीक्षण है जिसका उपयोग हम सांख्यिकीय परिकल्पना को अस्वीकार करने या विफल करने के लिए करते हैं।

यह ट्यूटोरियल बताता है कि आर में निम्नलिखित परिकल्पना परीक्षण कैसे करें:

  • एक नमूना टी परीक्षण
  • दो-नमूना टी-परीक्षण
  • युग्मित नमूने टी-परीक्षण

हम प्रत्येक प्रकार का परीक्षण करने के लिए R में t.test() फ़ंक्शन का उपयोग कर सकते हैं:

 #one sample t-test
t. test (x, y = NULL,
       alternative = c(" two.sided ", " less ", " greater "),
       mu = 0, paired = FALSE, var.equal = FALSE ,
       conf.level = 0.95, …)

सोना:

  • x, y: दो डेटा नमूने।
  • वैकल्पिक: परीक्षण की वैकल्पिक परिकल्पना।
  • म्यू: औसत का सही मूल्य।
  • युग्मित: युग्मित टी-परीक्षण करना है या नहीं।
  • var.equal: क्या यह मान लिया जाए कि नमूनों के बीच भिन्नताएँ समान हैं
  • conf.स्तर: उपयोग करने के लिए आत्मविश्वास का स्तर

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: आर में एक-नमूना टी-परीक्षण

एक-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि किसी जनसंख्या का माध्य एक निश्चित मूल्य के बराबर है या नहीं।

उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि कछुए की एक विशेष प्रजाति का औसत वजन 310 पाउंड है या नहीं। हम बाहर जाते हैं और निम्नलिखित वज़न वाले कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:

वजन : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

निम्नलिखित कोड दिखाता है कि आर में इस टी-परीक्षण उदाहरण को कैसे निष्पादित किया जाए:

 #define vector of turtle weights
turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)

#perform one sample t-test
t. test (x=turtle_weights,mu=310)

	One Sample t-test

data: turtle_weights
t = -1.5848, df = 12, p-value = 0.139
alternative hypothesis: true mean is not equal to 310
95 percent confidence interval:
 303.4236 311.0379
sample estimates:
mean of x 
 307.2308

परिणाम से हम देख सकते हैं:

  • टी-परीक्षण आँकड़ा: -1.5848
  • स्वतंत्रता की डिग्री: 12
  • पी-वैल्यू: 0.139
  • सही माध्य के लिए 95% विश्वास अंतराल: [303.4236, 311.0379]
  • कछुओं का औसत वजन: 307,230

चूँकि परीक्षण का पी-मान (0.139) 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं।

इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि इस कछुए की प्रजाति का औसत वजन 310 पाउंड के अलावा कुछ और है।

उदाहरण 2: आर में दो-नमूना टी-परीक्षण

दो-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि दो आबादी के साधन बराबर हैं या नहीं।

उदाहरण के लिए, मान लीजिए हम जानना चाहते हैं कि कछुओं की दो अलग-अलग प्रजातियों का औसत वजन बराबर है या नहीं। इसका परीक्षण करने के लिए, हम निम्नलिखित वजन के साथ प्रत्येक प्रजाति से कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:

नमूना 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

नमूना 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305

निम्नलिखित कोड दिखाता है कि आर में इन दो टी-परीक्षण उदाहरणों को कैसे निष्पादित किया जाए:

 #define vector of turtle weights for each sample
sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)
sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305)

#perform two sample t-tests
t. test (x = sample1, y = sample2)

	Welch Two Sample t-test

data: sample1 and sample2
t = -2.1009, df = 19.112, p-value = 0.04914
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.73862953 -0.03060124
sample estimates:
mean of x mean of y 
 307.2308 314.6154

परिणाम से हम देख सकते हैं:

  • टी-परीक्षण आँकड़ा: -2.1009
  • स्वतंत्रता की डिग्री: 19,112
  • पी-वैल्यू: 0.04914
  • वास्तविक माध्य अंतर के लिए 95% विश्वास अंतराल: [-14.74, -0.03]
  • नमूना 1 का औसत वजन: 307.2308
  • नमूना 2 का औसत वजन: 314.6154

चूँकि परीक्षण का पी-मान (0.04914) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।

इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि दोनों प्रजातियों के बीच औसत वजन बराबर नहीं है।

उदाहरण 3: R में युग्मित-नमूने t-परीक्षण

युग्मित नमूने टी-परीक्षण का उपयोग दो नमूनों के माध्यों की तुलना करने के लिए किया जाता है जब एक नमूने में प्रत्येक अवलोकन को दूसरे नमूने में एक अवलोकन के साथ जोड़ा जा सकता है।

उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि एक निश्चित प्रशिक्षण कार्यक्रम बास्केटबॉल खिलाड़ियों की अधिकतम ऊर्ध्वाधर छलांग (इंच में) बढ़ाने में सक्षम है या नहीं।

इसका परीक्षण करने के लिए, हम 12 कॉलेज बास्केटबॉल खिलाड़ियों का एक सरल यादृच्छिक नमूना भर्ती कर सकते हैं और उनकी प्रत्येक अधिकतम ऊर्ध्वाधर छलांग को माप सकते हैं। फिर हम प्रत्येक खिलाड़ी को एक महीने के लिए प्रशिक्षण कार्यक्रम का उपयोग करने के लिए कह सकते हैं और फिर महीने के अंत में उनकी अधिकतम ऊर्ध्वाधर छलांग को फिर से माप सकते हैं।

निम्नलिखित डेटा प्रत्येक खिलाड़ी के लिए प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में अधिकतम छलांग ऊंचाई (इंच में) दिखाता है:

सामने : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21

के बाद : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20

निम्नलिखित कोड दिखाता है कि आर में इस युग्मित-नमूने टी-परीक्षण को कैसे निष्पादित किया जाए:

 #define before and after max jump heights
before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21)
after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20)

#perform paired samples t-test
t. test (x = before, y = after, paired = TRUE )

	Paired t-test

data: before and after
t = -2.5289, df = 11, p-value = 0.02803
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.3379151 -0.1620849
sample estimates:
mean of the differences 
                  -1.25

परिणाम से हम देख सकते हैं:

  • टी-परीक्षण आँकड़ा: -2.5289
  • स्वतंत्रता की डिग्री: 11
  • पी-वैल्यू: 0.02803
  • वास्तविक माध्य अंतर के लिए 95% विश्वास अंतराल: [-2.34, -0.16]
  • पहले और बाद के बीच औसत अंतर: -1.25

चूँकि परीक्षण का पी-मान (0.02803) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।

इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में औसत छलांग ऊंचाई बराबर नहीं है।

अतिरिक्त संसाधन

विभिन्न टी-परीक्षणों को स्वचालित रूप से निष्पादित करने के लिए निम्नलिखित ऑनलाइन कैलकुलेटर का उपयोग करें:

टी-टेस्ट कैलकुलेटर का एक उदाहरण
दो-नमूना टी-टेस्ट कैलकुलेटर
युग्मित नमूने टी-टेस्ट कैलकुलेटर

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *