आर में व्यवस्थित नमूनाकरण (उदाहरण के साथ)


शोधकर्ता अक्सर किसी जनसंख्या से नमूने लेते हैं और संपूर्ण जनसंख्या के बारे में निष्कर्ष निकालने के लिए नमूने से प्राप्त डेटा का उपयोग करते हैं।

आमतौर पर इस्तेमाल की जाने वाली नमूनाकरण विधि व्यवस्थित नमूनाकरण है, जिसे एक सरल दो-चरणीय प्रक्रिया में कार्यान्वित किया जाता है:

1. जनसंख्या के प्रत्येक सदस्य को एक निश्चित क्रम में रखें।

2. एक यादृच्छिक प्रारंभिक बिंदु चुनें और नमूने का हिस्सा बनने के लिए n में से एक सदस्य का चयन करें।

यह ट्यूटोरियल बताता है कि आर में व्यवस्थित नमूनाकरण कैसे करें।

उदाहरण: आर में व्यवस्थित नमूनाकरण

मान लीजिए कि एक प्रिंसिपल ऐसे स्कूल से 100 छात्रों का एक नमूना प्राप्त करना चाहता है जिसमें कुल 500 छात्र हैं। वह व्यवस्थित नमूनाकरण का उपयोग करना चुनती है जिसमें वह प्रत्येक छात्र को उनके अंतिम नाम के आधार पर वर्णमाला क्रम में रखती है, यादृच्छिक रूप से एक प्रारंभिक बिंदु चुनती है, और नमूने में शामिल होने के लिए हर पांचवें छात्र का चयन करती है।

निम्नलिखित कोड दिखाता है कि आर में काम करने के लिए नकली डेटा फ्रेम कैसे बनाया जाए:

 #make this example reproducible
set.seed(1)

#create simple function to generate random last names
randomNames <- function (n = 5000) {
  do.call(paste0, replicate(5, sample(LETTERS, n, TRUE), FALSE))
}

#create data frame
df <- data.frame(last_name = randomNames(500),
                 gpa = rnorm(500, mean=82, sd=3))

#view first six rows of data frame
head(df)

  last_name gpa
1 GONBW 82.19580
2 JRRWZ 85.10598
3 ORJFW 88.78065
4 XRYNL 85.94409
5 FMDCE 79.38993
6 XZBJC 80.49061

और निम्नलिखित कोड दिखाता है कि व्यवस्थित नमूने के माध्यम से 100 छात्रों का नमूना कैसे प्राप्त किया जाए:

 #define function to obtain systematic sample
obtain_sys = function (N,n){
  k = ceiling(N/n)
  r = sample(1:k, 1)
  seq(r, r + k*(n-1), k)
}

#obtain systematic sample
sys_sample_df = df[obtain_sys( nrow (df), 100), ]

#view first six rows of data frame
head(sys_sample_df)

   last_name gpa
3 ORJFW 88.78065
8 RWPSB 81.96988
13 RACZU 79.21433
18 ZOHKA 80.47246
23 QJETK 87.09991
28 JTHWB 83.87300

#view dimensions of data frame
dim(sys_sample_df)

[1] 100 2

ध्यान दें कि नमूने में शामिल पहला सदस्य मूल डेटा फ़्रेम की पंक्ति 3 में था। नमूने का प्रत्येक अगला सदस्य पिछले सदस्य के 5 पंक्तियों के बाद स्थित है।

और dim() का उपयोग करके, हम देख सकते हैं कि हमें जो व्यवस्थित नमूना मिला है वह 100 पंक्तियों और 2 स्तंभों का एक डेटा फ़्रेम है।

अतिरिक्त संसाधन

नमूनाकरण विधियों के प्रकार
आर में स्तरीकृत नमूनाकरण
आर में क्लस्टर नमूनाकरण

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *