आर में नमूना वितरण की गणना कैसे करें


एक नमूना वितरण एक एकल आबादी से कई यादृच्छिक नमूनों के आधार पर एक निश्चित आंकड़े का संभाव्यता वितरण है।

यह ट्यूटोरियल बताता है कि आर में नमूना वितरण के साथ निम्नलिखित कैसे करें:

  • एक नमूना वितरण उत्पन्न करें.
  • नमूना वितरण की कल्पना करें.
  • नमूना वितरण के माध्य और मानक विचलन की गणना करें।
  • नमूना वितरण के संबंध में संभावनाओं की गणना करें।

आर में एक नमूना वितरण उत्पन्न करें

निम्नलिखित कोड दिखाता है कि आर में नमूना वितरण कैसे उत्पन्न किया जाए:

 #make this example reproducible
set.seed(0)

#define number of samples
n = 10000

#create empty vector of length n
sample_means = rep (NA, n)

#fill empty vector with means
for (i in 1:n){
  sample_means[i] = mean ( rnorm (20, mean=5.3, sd=9))
}

#view first six sample means
head(sample_means)

[1] 5.283992 6.304845 4.259583 3.915274 7.756386 4.532656

इस उदाहरण में, हमने 10,000 नमूनों के औसत की गणना करने के लिए rnorm() फ़ंक्शन का उपयोग किया, जिसमें प्रत्येक नमूना आकार 20 था और 5.3 के माध्य और 9 के मानक विचलन के साथ सामान्य वितरण से उत्पन्न हुआ था।

हम देख सकते हैं कि पहले नमूने का माध्य 5.283992 था, दूसरे नमूने का माध्य 6.304845 था, इत्यादि।

नमूना वितरण की कल्पना करें

निम्नलिखित कोड दिखाता है कि नमूना वितरण को देखने के लिए एक सरल हिस्टोग्राम कैसे बनाया जाए:

 #create histogram to visualize the sampling distribution
hist(sample_means, main = "", xlab = " Sample Means ", col = " steelblue ")

आर हिस्टोग्राम में नमूना वितरण

यह देखा जा सकता है कि नमूना वितरण घंटी के आकार का है जिसका शिखर मान 5 के करीब है।

हालाँकि, वितरण के विवरण से हम देख सकते हैं कि कुछ नमूनों का मतलब 10 से अधिक था और अन्य का मतलब 0 से कम था।

माध्य और मानक विचलन ज्ञात कीजिए

निम्नलिखित कोड दिखाता है कि नमूना वितरण के माध्य और मानक विचलन की गणना कैसे करें:

 #mean of sampling distribution
mean(sample_means)

[1] 5.287195

#standard deviation of sampling distribution
sd(sample_means)

[1] 2.00224

सैद्धांतिक रूप से, नमूना वितरण का माध्य 5.3 होना चाहिए। हम देख सकते हैं कि इस उदाहरण में वास्तविक नमूना माध्य 5.287195 है, जो 5.3 के करीब है।

और सैद्धांतिक रूप से, नमूना वितरण का मानक विचलन s/√n के बराबर होना चाहिए, जो 9 / √20 = 2.012 होगा। हम देख सकते हैं कि नमूना वितरण का वास्तविक मानक विचलन 2.00224 है, जो 2.012 के करीब है।

संभावनाओं की गणना करें

निम्नलिखित कोड दिखाता है कि जनसंख्या माध्य, जनसंख्या मानक विचलन और नमूना आकार को देखते हुए नमूना माध्य के लिए एक निश्चित मूल्य प्राप्त करने की संभावना की गणना कैसे की जाए।

 #calculate probability that sample mean is less than or equal to 6
sum(sample_means <= 6) / length(sample_means)

इस विशेष उदाहरण में, हम संभावना पाते हैं कि नमूना माध्य 6 से कम या उसके बराबर है, यह देखते हुए कि जनसंख्या माध्य 5.3 है, जनसंख्या मानक विचलन 9 है, और 20 के नमूने का आकार 0.6417 है।

यह नमूनाकरण वितरण कैलकुलेटर द्वारा गणना की गई संभावना के बहुत करीब है:

नमूना वितरण की गणना

पूरा कोड

इस उदाहरण में प्रयुक्त संपूर्ण R कोड नीचे दिखाया गया है:

 #make this example reproducible
set.seed(0)

#define number of samples
n = 10000

#create empty vector of length n
sample_means = rep (NA, n)

#fill empty vector with means
for (i in 1:n){
  sample_means[i] = mean ( rnorm (20, mean=5.3, sd=9))
}

#view first six sample means
head(sample_means)

#create histogram to visualize the sampling distribution
hist(sample_means, main = "", xlab = " Sample Means ", col = " steelblue ")

#mean of sampling distribution
mean(sample_means)

#standard deviation of sampling distribution
sd(sample_means)

#calculate probability that sample mean is less than or equal to 6
sum(sample_means <= 6) / length(sample_means)

अतिरिक्त संसाधन

नमूना वितरण का एक परिचय
नमूना वितरण कैलकुलेटर
केंद्रीय सीमा प्रमेय का एक परिचय

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *