संपूर्ण मार्गदर्शिका: आर में परिकल्पना परीक्षण
परिकल्पना परीक्षण एक औपचारिक सांख्यिकीय परीक्षण है जिसका उपयोग हम सांख्यिकीय परिकल्पना को अस्वीकार करने या विफल करने के लिए करते हैं।
यह ट्यूटोरियल बताता है कि आर में निम्नलिखित परिकल्पना परीक्षण कैसे करें:
- एक नमूना टी परीक्षण
- दो-नमूना टी-परीक्षण
- युग्मित नमूने टी-परीक्षण
हम प्रत्येक प्रकार का परीक्षण करने के लिए R में t.test() फ़ंक्शन का उपयोग कर सकते हैं:
#one sample t-test t. test (x, y = NULL, alternative = c(" two.sided ", " less ", " greater "), mu = 0, paired = FALSE, var.equal = FALSE , conf.level = 0.95, …)
सोना:
- x, y: दो डेटा नमूने।
- वैकल्पिक: परीक्षण की वैकल्पिक परिकल्पना।
- म्यू: औसत का सही मूल्य।
- युग्मित: युग्मित टी-परीक्षण करना है या नहीं।
- var.equal: क्या यह मान लिया जाए कि नमूनों के बीच भिन्नताएँ समान हैं ।
- conf.स्तर: उपयोग करने के लिए आत्मविश्वास का स्तर ।
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण 1: आर में एक-नमूना टी-परीक्षण
एक-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि किसी जनसंख्या का माध्य एक निश्चित मूल्य के बराबर है या नहीं।
उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि कछुए की एक विशेष प्रजाति का औसत वजन 310 पाउंड है या नहीं। हम बाहर जाते हैं और निम्नलिखित वज़न वाले कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:
वजन : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
निम्नलिखित कोड दिखाता है कि आर में इस टी-परीक्षण उदाहरण को कैसे निष्पादित किया जाए:
#define vector of turtle weights turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) #perform one sample t-test t. test (x=turtle_weights,mu=310) One Sample t-test data: turtle_weights t = -1.5848, df = 12, p-value = 0.139 alternative hypothesis: true mean is not equal to 310 95 percent confidence interval: 303.4236 311.0379 sample estimates: mean of x 307.2308
परिणाम से हम देख सकते हैं:
- टी-परीक्षण आँकड़ा: -1.5848
- स्वतंत्रता की डिग्री: 12
- पी-वैल्यू: 0.139
- सही माध्य के लिए 95% विश्वास अंतराल: [303.4236, 311.0379]
- कछुओं का औसत वजन: 307,230
चूँकि परीक्षण का पी-मान (0.139) 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं।
इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि इस कछुए की प्रजाति का औसत वजन 310 पाउंड के अलावा कुछ और है।
उदाहरण 2: आर में दो-नमूना टी-परीक्षण
दो-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि दो आबादी के साधन बराबर हैं या नहीं।
उदाहरण के लिए, मान लीजिए हम जानना चाहते हैं कि कछुओं की दो अलग-अलग प्रजातियों का औसत वजन बराबर है या नहीं। इसका परीक्षण करने के लिए, हम निम्नलिखित वजन के साथ प्रत्येक प्रजाति से कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:
नमूना 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
नमूना 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305
निम्नलिखित कोड दिखाता है कि आर में इन दो टी-परीक्षण उदाहरणों को कैसे निष्पादित किया जाए:
#define vector of turtle weights for each sample sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305) #perform two sample t-tests t. test (x = sample1, y = sample2) Welch Two Sample t-test data: sample1 and sample2 t = -2.1009, df = 19.112, p-value = 0.04914 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.73862953 -0.03060124 sample estimates: mean of x mean of y 307.2308 314.6154
परिणाम से हम देख सकते हैं:
- टी-परीक्षण आँकड़ा: -2.1009
- स्वतंत्रता की डिग्री: 19,112
- पी-वैल्यू: 0.04914
- वास्तविक माध्य अंतर के लिए 95% विश्वास अंतराल: [-14.74, -0.03]
- नमूना 1 का औसत वजन: 307.2308
- नमूना 2 का औसत वजन: 314.6154
चूँकि परीक्षण का पी-मान (0.04914) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।
इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि दोनों प्रजातियों के बीच औसत वजन बराबर नहीं है।
उदाहरण 3: R में युग्मित-नमूने t-परीक्षण
युग्मित नमूने टी-परीक्षण का उपयोग दो नमूनों के माध्यों की तुलना करने के लिए किया जाता है जब एक नमूने में प्रत्येक अवलोकन को दूसरे नमूने में एक अवलोकन के साथ जोड़ा जा सकता है।
उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि एक निश्चित प्रशिक्षण कार्यक्रम बास्केटबॉल खिलाड़ियों की अधिकतम ऊर्ध्वाधर छलांग (इंच में) बढ़ाने में सक्षम है या नहीं।
इसका परीक्षण करने के लिए, हम 12 कॉलेज बास्केटबॉल खिलाड़ियों का एक सरल यादृच्छिक नमूना भर्ती कर सकते हैं और उनकी प्रत्येक अधिकतम ऊर्ध्वाधर छलांग को माप सकते हैं। फिर हम प्रत्येक खिलाड़ी को एक महीने के लिए प्रशिक्षण कार्यक्रम का उपयोग करने के लिए कह सकते हैं और फिर महीने के अंत में उनकी अधिकतम ऊर्ध्वाधर छलांग को फिर से माप सकते हैं।
निम्नलिखित डेटा प्रत्येक खिलाड़ी के लिए प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में अधिकतम छलांग ऊंचाई (इंच में) दिखाता है:
सामने : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
के बाद : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20
निम्नलिखित कोड दिखाता है कि आर में इस युग्मित-नमूने टी-परीक्षण को कैसे निष्पादित किया जाए:
#define before and after max jump heights before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21) after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20) #perform paired samples t-test t. test (x = before, y = after, paired = TRUE ) Paired t-test data: before and after t = -2.5289, df = 11, p-value = 0.02803 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.3379151 -0.1620849 sample estimates: mean of the differences -1.25
परिणाम से हम देख सकते हैं:
- टी-परीक्षण आँकड़ा: -2.5289
- स्वतंत्रता की डिग्री: 11
- पी-वैल्यू: 0.02803
- वास्तविक माध्य अंतर के लिए 95% विश्वास अंतराल: [-2.34, -0.16]
- पहले और बाद के बीच औसत अंतर: -1.25
चूँकि परीक्षण का पी-मान (0.02803) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।
इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में औसत छलांग ऊंचाई बराबर नहीं है।
अतिरिक्त संसाधन
विभिन्न टी-परीक्षणों को स्वचालित रूप से निष्पादित करने के लिए निम्नलिखित ऑनलाइन कैलकुलेटर का उपयोग करें:
टी-टेस्ट कैलकुलेटर का एक उदाहरण
दो-नमूना टी-टेस्ट कैलकुलेटर
युग्मित नमूने टी-टेस्ट कैलकुलेटर