Pengambilan sampel cluster di r: dengan contoh


Peneliti sering kali mengambil sampel dari suatu populasi dan menggunakan data dari sampel tersebut untuk menarik kesimpulan tentang populasi secara keseluruhan.

Metode pengambilan sampel yang umum digunakan adalah cluster sampling , yaitu suatu populasi dibagi menjadi beberapa cluster dan seluruh anggota cluster tertentu dipilih untuk dimasukkan ke dalam sampel.

Tutorial ini menjelaskan cara melakukan pengambilan sampel cluster di R.

Contoh: Pengambilan Sampel Cluster di R

Katakanlah sebuah perusahaan yang menawarkan tur kota ingin mensurvei pelanggannya. Dari sepuluh tur yang mereka tawarkan per hari, mereka secara acak memilih empat tur dan meminta setiap pelanggan menilai pengalaman mereka dalam skala 1 hingga 10.

Kode berikut menunjukkan cara membuat bingkai data palsu di R untuk digunakan:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#view first six rows of data frame
head(df)

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

Dan kode berikut menunjukkan cara mendapatkan sampel pelanggan dengan memilih empat kunjungan secara acak dan memasukkan setiap anggota kunjungan tersebut ke dalam sampel:

 #randomly choose 4 tour groups out of the 10
clusters <- sample( unique (df$tour), size=4, replace= F )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters, ]

#view how many customers came from each tour
table(cluster_sample$tour)

 2 7 8 10 
20 20 20 20 

Dari hasilnya kita dapat melihat bahwa:

  • 20 pelanggan dari kelompok wisata #2 dimasukkan dalam sampel.
  • 20 pelanggan dari grup tur #7 dimasukkan dalam sampel.
  • 20 pelanggan dari grup tur #8 dimasukkan dalam sampel.
  • 20 pelanggan dari grup tur #10 dimasukkan dalam sampel.

Jadi, sampel ini terdiri dari total 80 pelanggan yang berasal dari 4 kelompok wisatawan berbeda.

Terkait: Cara menggunakan operator %in% di R

Sumber daya tambahan

Memahami berbagai jenis metode pengambilan sampel
Pengambilan sampel bertingkat di R
Pengambilan sampel sistematis di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *