आर में स्तरीकृत नमूनाकरण (उदाहरण के साथ)
शोधकर्ता अक्सर किसी जनसंख्या से नमूने लेते हैं और संपूर्ण जनसंख्या के बारे में निष्कर्ष निकालने के लिए नमूने से प्राप्त डेटा का उपयोग करते हैं।
आमतौर पर इस्तेमाल की जाने वाली नमूना पद्धति स्तरीकृत यादृच्छिक नमूनाकरण है, जिसमें एक आबादी को समूहों में विभाजित किया जाता है और प्रत्येक समूह से एक निश्चित संख्या में सदस्यों को नमूने में शामिल करने के लिए यादृच्छिक रूप से चुना जाता है।
यह ट्यूटोरियल बताता है कि आर में स्तरीकृत यादृच्छिक नमूनाकरण कैसे करें।
उदाहरण: आर में स्तरीकृत नमूनाकरण
एक हाई स्कूल 400 छात्रों से बना होता है जो या तो नए छात्र, द्वितीय वर्ष, जूनियर या वरिष्ठ होते हैं। मान लीजिए कि हम 40 छात्रों का एक स्तरीकृत नमूना लेना चाहते हैं, ताकि प्रत्येक कक्षा से 10 छात्र नमूने में शामिल हों।
निम्नलिखित कोड दिखाता है कि 400 छात्रों का नमूना डेटा फ्रेम कैसे तैयार किया जाए:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(grade = rep(c('Freshman', 'Sophomore', 'Junior', 'Senior'), each =100), gpa = rnorm(400, mean=85, sd=3)) #view first six rows of data frame head(df) gpa grade 1 Freshman 83.12064 2 Freshman 85.55093 3 Freshman 82.49311 4 Freshman 89.78584 5 Freshman 85.98852 6 Freshman 82.53859
पंक्ति गणना का उपयोग करके स्तरीकृत नमूनाकरण
निम्नलिखित कोड दिखाता है कि प्रत्येक ग्रेड से 10 छात्रों के साथ 40 कुल छात्रों का एक स्तरीकृत यादृच्छिक नमूना प्राप्त करने के लिए dplyr पैकेज से ग्रुप_बी() और सैंपल_एन() फ़ंक्शन का उपयोग कैसे करें:
library (dplyr) #obtain laminated sample strat_sample <- df %>% group_by (grade) %>% sample_n (size=10) #find frequency of students from each grade table(strat_sample$grade) Freshman Junior Senior Sophomore 10 10 10 10
पंक्तियों के अंश का उपयोग करके स्तरीकृत नमूनाकरण
निम्नलिखित कोड दिखाता है कि एक स्तरीकृत यादृच्छिक नमूना प्राप्त करने के लिए dplyr पैकेज से ग्रुप_बाय() और सैंपल_फ्रैक() फ़ंक्शन का उपयोग कैसे करें, जिसमें से हम प्रत्येक ग्रेड में 15% छात्रों को यादृच्छिक रूप से चुनते हैं:
library (dplyr) #obtain laminated sample strat_sample <- df %>% group_by (grade) %>% sample_frac (size=.15) #find frequency of students from each grade table(strat_sample$grade) Freshman Junior Senior Sophomore 15 15 15 15
अतिरिक्त संसाधन
नमूनाकरण विधियों के प्रकार
आर में क्लस्टर नमूनाकरण
आर में व्यवस्थित नमूनाकरण