असमान नमूना आकारों के साथ टी-परीक्षण कैसे करें


जब सांख्यिकी की बात आती है तो छात्र अक्सर एक प्रश्न पूछते हैं:

जब प्रत्येक समूह का नमूना आकार समान न हो तो क्या टी-परीक्षण करना संभव है?

संक्षिप्त उत्तर:

हां, जब नमूना आकार बराबर न हो तो आप टी-परीक्षण कर सकते हैं। समान नमूना आकार टी-टेस्ट में की गई धारणाओं में से एक नहीं है।

वास्तविक समस्याएँ तब उत्पन्न होती हैं जब दो नमूनों में समान भिन्नताएँ नहीं होती हैं, जो कि टी-परीक्षण में की गई धारणाओं में से एक है

जब ऐसा होता है, तो इसके बजाय वेल्च के टी-टेस्ट का उपयोग करने की अनुशंसा की जाती है, जो समान भिन्नताओं को नहीं मानता है।

निम्नलिखित उदाहरण दिखाते हैं कि असमान नमूना आकारों के साथ टी परीक्षण कैसे करें जब भिन्नताएं समान हों और जब वे समान न हों।

उदाहरण 1: असमान नमूना आकार और समान भिन्नताएँ

मान लीजिए कि हम छात्रों को कुछ परीक्षाओं में बेहतर प्रदर्शन करने में मदद करने के लिए डिज़ाइन किए गए दो कार्यक्रम संचालित करते हैं।

परिणाम इस प्रकार हैं:

कार्यक्रम 1:

  • n (नमूना आकार): 500
  • x (नमूना औसत): 80
  • s (नमूना मानक विचलन): 5

कार्यक्रम 2:

  • n (नमूना आकार): 20
  • x (नमूना औसत): 85
  • s (नमूना मानक विचलन): 5

निम्नलिखित कोड दिखाता है कि प्रत्येक कार्यक्रम के लिए परीक्षा अंकों के वितरण की कल्पना करने के लिए आर में एक बॉक्सप्लॉट कैसे बनाया जाए:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=5)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

प्रोग्राम 2 के लिए औसत परीक्षा स्कोर अधिक प्रतीत होता है, लेकिन दोनों कार्यक्रमों के बीच परीक्षा स्कोर में अंतर लगभग बराबर है।

निम्नलिखित कोड दिखाता है कि वेल्च के टी-परीक्षण के साथ एक स्वतंत्र नमूना टी-परीक्षण कैसे किया जाए:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -3.3348, df = 518, p-value = 0.0009148
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.111504 -1.580245
sample estimates:
mean of x mean of y 
 80.11322 83.95910

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -3.3735, df = 20.589, p-value = 0.00293
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.219551 -1.472199
sample estimates:
mean of x mean of y 
 80.11322 83.95910 

स्वतंत्र नमूने का टी-परीक्षण 0.0009 का पी-मान देता है और वेल्च का टी-परीक्षण 0.0029 का पी-मान देता है।

चूँकि प्रत्येक परीक्षण का पी-मान 0.05 से कम है, हम प्रत्येक परीक्षण में शून्य परिकल्पना को अस्वीकार कर देंगे और निष्कर्ष निकालेंगे कि दोनों कार्यक्रमों के बीच औसत परीक्षा स्कोर में सांख्यिकीय रूप से महत्वपूर्ण अंतर है।

भले ही नमूना आकार असमान हैं, स्वतंत्र नमूने टी-परीक्षण और वेल्च के टी-परीक्षण दोनों समान परिणाम देते हैं क्योंकि दोनों नमूनों में समान भिन्नताएं थीं।

उदाहरण 2: असमान नमूना आकार और असमान भिन्नताएँ

मान लीजिए कि हम छात्रों को कुछ परीक्षाओं में बेहतर प्रदर्शन करने में मदद करने के लिए डिज़ाइन किए गए दो कार्यक्रम संचालित करते हैं।

परिणाम इस प्रकार हैं:

कार्यक्रम 1:

  • n (नमूना आकार): 500
  • x (नमूना औसत): 80
  • s (नमूना मानक विचलन): 25

कार्यक्रम 2:

  • n (नमूना आकार): 20
  • x (नमूना औसत): 85
  • s (नमूना मानक विचलन): 5

निम्नलिखित कोड दिखाता है कि प्रत्येक कार्यक्रम के लिए परीक्षा अंकों के वितरण की कल्पना करने के लिए आर में एक बॉक्सप्लॉट कैसे बनाया जाए:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=25)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

प्रोग्राम 2 के लिए औसत परीक्षा स्कोर अधिक प्रतीत होता है, लेकिन प्रोग्राम 1 के लिए परीक्षा स्कोर का अंतर प्रोग्राम 2 की तुलना में बहुत अधिक है।

निम्नलिखित कोड दिखाता है कि वेल्च के टी-परीक्षण के साथ एक स्वतंत्र नमूना टी-परीक्षण कैसे किया जाए:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -0.5988, df = 518, p-value = 0.5496
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.52474 7.73875
sample estimates:
mean of x mean of y 
  80.5661 83.9591

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -2.1338, df = 74.934, p-value = 0.03613
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.560690 -0.225296
sample estimates:
mean of x mean of y 
  80.5661 83.9591 

स्वतंत्र नमूने का टी-परीक्षण 0.5496 का पी-मान देता है और वेल्च का टी-परीक्षण 0.0361 का पी-मान देता है।

स्वतंत्र नमूने टी-परीक्षण औसत परीक्षा स्कोर में अंतर का पता लगाने में सक्षम नहीं है, लेकिन वेल्च का टी-परीक्षण सांख्यिकीय रूप से महत्वपूर्ण अंतर का पता लगाने में सक्षम है।

चूँकि दोनों नमूनों में असमान भिन्नताएँ थीं, केवल वेल्च का टी-परीक्षण ही औसत परीक्षा अंकों में सांख्यिकीय रूप से महत्वपूर्ण अंतर का पता लगाने में सक्षम था, क्योंकि यह परीक्षण नमूनों के बीच समान भिन्नताओं को नहीं मानता है

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल टी-परीक्षणों के बारे में अतिरिक्त जानकारी प्रदान करते हैं:

एक-नमूना टी-टेस्ट का परिचय
दो-नमूना टी परीक्षण का परिचय
युग्मित नमूने टी-परीक्षण का परिचय

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *