Pengambilan sampel sistematis di r (dengan contoh)


Peneliti sering kali mengambil sampel dari suatu populasi dan menggunakan data dari sampel tersebut untuk menarik kesimpulan tentang populasi secara keseluruhan.

Metode pengambilan sampel yang umum digunakan adalah pengambilan sampel sistematis , yang diterapkan dalam proses dua langkah sederhana:

1. Tempatkan setiap anggota populasi dalam urutan tertentu.

2. Pilih titik awal secara acak dan pilih satu dari n anggota untuk menjadi bagian sampel.

Tutorial ini menjelaskan cara melakukan pengambilan sampel sistematis di R.

Contoh: pengambilan sampel sistematis di R

Misalkan seorang kepala sekolah ingin memperoleh sampel sebanyak 100 siswa dari suatu sekolah yang mempunyai jumlah siswa sebanyak 500 orang. Dia memilih untuk menggunakan pengambilan sampel sistematis di mana dia menempatkan setiap siswa dalam urutan abjad berdasarkan nama belakang mereka, secara acak memilih titik awal, dan memilih setiap siswa kelima untuk dijadikan sampel.

Kode berikut menunjukkan cara membuat bingkai data palsu untuk digunakan di R:

 #make this example reproducible
set.seed(1)

#create simple function to generate random last names
randomNames <- function (n = 5000) {
  do.call(paste0, replicate(5, sample(LETTERS, n, TRUE), FALSE))
}

#create data frame
df <- data.frame(last_name = randomNames(500),
                 gpa = rnorm(500, mean=82, sd=3))

#view first six rows of data frame
head(df)

  last_name gpa
1 GONBW 82.19580
2 JRRWZ 85.10598
3 ORJFW 88.78065
4 XRYNL 85.94409
5 FMDCE 79.38993
6 XZBJC 80.49061

Dan kode berikut menunjukkan cara memperoleh sampel sebanyak 100 siswa melalui sistematik sampling:

 #define function to obtain systematic sample
obtain_sys = function (N,n){
  k = ceiling(N/n)
  r = sample(1:k, 1)
  seq(r, r + k*(n-1), k)
}

#obtain systematic sample
sys_sample_df = df[obtain_sys( nrow (df), 100), ]

#view first six rows of data frame
head(sys_sample_df)

   last_name gpa
3 ORJFW 88.78065
8 RWPSB 81.96988
13 RACZU 79.21433
18 ZOHKA 80.47246
23 QJETK 87.09991
28 JTHWB 83.87300

#view dimensions of data frame
dim(sys_sample_df)

[1] 100 2

Perhatikan bahwa anggota pertama yang disertakan dalam sampel berada di baris 3 bingkai data asli. Setiap anggota sampel berikutnya terletak 5 baris setelah anggota sebelumnya.

Dan dengan menggunakan dim() , kita dapat melihat bahwa sampel sistematis yang kita peroleh adalah kerangka data 100 baris dan 2 kolom.

Sumber daya tambahan

Jenis Metode Pengambilan Sampel
Pengambilan sampel bertingkat di R
Pengambilan sampel cluster di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *