आर में क्लस्टर नमूनाकरण: उदाहरणों के साथ
शोधकर्ता अक्सर किसी जनसंख्या से नमूने लेते हैं और संपूर्ण जनसंख्या के बारे में निष्कर्ष निकालने के लिए नमूने से प्राप्त डेटा का उपयोग करते हैं।
आमतौर पर इस्तेमाल की जाने वाली नमूना पद्धति क्लस्टर नमूनाकरण है, जिसमें एक आबादी को समूहों में विभाजित किया जाता है और कुछ समूहों के सभी सदस्यों को नमूने में शामिल करने के लिए चुना जाता है।
यह ट्यूटोरियल बताता है कि आर में क्लस्टर सैंपलिंग कैसे करें।
उदाहरण: आर में क्लस्टर नमूनाकरण
मान लीजिए कि शहर भ्रमण की पेशकश करने वाली एक कंपनी अपने ग्राहकों का सर्वेक्षण करना चाहती है। वे प्रति दिन पेश किए जाने वाले दस दौरों में से, बेतरतीब ढंग से चार दौरों का चयन करते हैं और प्रत्येक ग्राहक से अपने अनुभव को 1 से 10 के पैमाने पर रेटिंग देने के लिए कहते हैं।
निम्नलिखित कोड दिखाता है कि आर में काम करने के लिए नकली डेटा फ्रेम कैसे बनाया जाए:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)) #view first six rows of data frame head(df) tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
और निम्नलिखित कोड दिखाता है कि यादृच्छिक रूप से चार विज़िट का चयन करके और नमूने में उन विज़िट के प्रत्येक सदस्य को शामिल करके ग्राहकों का नमूना कैसे प्राप्त किया जाए:
#randomly choose 4 tour groups out of the 10 clusters <- sample( unique (df$tour), size=4, replace= F ) #define sample as all members who belong to one of the 4 tour groups cluster_sample <- df[df$tour %in% clusters, ] #view how many customers came from each tour table(cluster_sample$tour) 2 7 8 10 20 20 20 20
परिणाम से हम देख सकते हैं कि:
- पर्यटक समूह #2 के 20 ग्राहकों को नमूने में शामिल किया गया था।
- टूर ग्रुप #7 के 20 ग्राहकों को नमूने में शामिल किया गया था।
- टूर ग्रुप #8 के 20 ग्राहकों को नमूने में शामिल किया गया था।
- टूर ग्रुप #10 के 20 ग्राहकों को नमूने में शामिल किया गया था।
इस प्रकार, यह नमूना 4 अलग-अलग पर्यटक समूहों के कुल 80 ग्राहकों से बना है।
संबंधित: R में %in% ऑपरेटर का उपयोग कैसे करें
अतिरिक्त संसाधन
विभिन्न प्रकार की नमूनाकरण विधियों को समझना
आर में स्तरीकृत नमूनाकरण
आर में व्यवस्थित नमूनाकरण