आर में स्तरीकृत नमूनाकरण (उदाहरण के साथ)


शोधकर्ता अक्सर किसी जनसंख्या से नमूने लेते हैं और संपूर्ण जनसंख्या के बारे में निष्कर्ष निकालने के लिए नमूने से प्राप्त डेटा का उपयोग करते हैं।

आमतौर पर इस्तेमाल की जाने वाली नमूना पद्धति स्तरीकृत यादृच्छिक नमूनाकरण है, जिसमें एक आबादी को समूहों में विभाजित किया जाता है और प्रत्येक समूह से एक निश्चित संख्या में सदस्यों को नमूने में शामिल करने के लिए यादृच्छिक रूप से चुना जाता है।

यह ट्यूटोरियल बताता है कि आर में स्तरीकृत यादृच्छिक नमूनाकरण कैसे करें।

उदाहरण: आर में स्तरीकृत नमूनाकरण

एक हाई स्कूल 400 छात्रों से बना होता है जो या तो नए छात्र, द्वितीय वर्ष, जूनियर या वरिष्ठ होते हैं। मान लीजिए कि हम 40 छात्रों का एक स्तरीकृत नमूना लेना चाहते हैं, ताकि प्रत्येक कक्षा से 10 छात्र नमूने में शामिल हों।

निम्नलिखित कोड दिखाता है कि 400 छात्रों का नमूना डेटा फ्रेम कैसे तैयार किया जाए:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(grade = rep(c('Freshman', 'Sophomore', 'Junior', 'Senior'), each =100),
                 gpa = rnorm(400, mean=85, sd=3))

#view first six rows of data frame
head(df)

     gpa grade
1 Freshman 83.12064
2 Freshman 85.55093
3 Freshman 82.49311
4 Freshman 89.78584
5 Freshman 85.98852
6 Freshman 82.53859

पंक्ति गणना का उपयोग करके स्तरीकृत नमूनाकरण

निम्नलिखित कोड दिखाता है कि प्रत्येक ग्रेड से 10 छात्रों के साथ 40 कुल छात्रों का एक स्तरीकृत यादृच्छिक नमूना प्राप्त करने के लिए dplyr पैकेज से ग्रुप_बी() और सैंपल_एन() फ़ंक्शन का उपयोग कैसे करें:

 library (dplyr)

#obtain laminated sample
strat_sample <- df %>%
                  group_by (grade) %>%
                  sample_n (size=10)

#find frequency of students from each grade
table(strat_sample$grade)

 Freshman Junior Senior Sophomore 
       10 10 10 10 

पंक्तियों के अंश का उपयोग करके स्तरीकृत नमूनाकरण

निम्नलिखित कोड दिखाता है कि एक स्तरीकृत यादृच्छिक नमूना प्राप्त करने के लिए dplyr पैकेज से ग्रुप_बाय() और सैंपल_फ्रैक() फ़ंक्शन का उपयोग कैसे करें, जिसमें से हम प्रत्येक ग्रेड में 15% छात्रों को यादृच्छिक रूप से चुनते हैं:

 library (dplyr)

#obtain laminated sample
strat_sample <- df %>%
                  group_by (grade) %>%
                  sample_frac (size=.15)

#find frequency of students from each grade
table(strat_sample$grade)

 Freshman Junior Senior Sophomore 
       15 15 15 15

अतिरिक्त संसाधन

नमूनाकरण विधियों के प्रकार
आर में क्लस्टर नमूनाकरण
आर में व्यवस्थित नमूनाकरण

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *