Pengambilan sampel berstrata di r (dengan contoh)


Peneliti sering kali mengambil sampel dari suatu populasi dan menggunakan data dari sampel tersebut untuk menarik kesimpulan tentang populasi secara keseluruhan.

Metode pengambilan sampel yang umum digunakan adalah stratified random sampling , yaitu suatu populasi dibagi menjadi beberapa kelompok dan sejumlah anggota dari setiap kelompok dipilih secara acak untuk dimasukkan ke dalam sampel.

Tutorial ini menjelaskan cara melakukan pengambilan sampel acak bertingkat di R.

Contoh: Pengambilan Sampel Berstrata di R

Sebuah sekolah menengah terdiri dari 400 siswa yang merupakan mahasiswa baru, mahasiswa tahun kedua, junior atau senior. Misalkan kita ingin mengambil sampel bertingkat sebanyak 40 siswa, sehingga 10 siswa dari tiap kelas dimasukkan dalam sampel.

Kode berikut menunjukkan cara menghasilkan kerangka data sampel 400 siswa:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(grade = rep(c('Freshman', 'Sophomore', 'Junior', 'Senior'), each =100),
                 gpa = rnorm(400, mean=85, sd=3))

#view first six rows of data frame
head(df)

     gpa grade
1 Freshman 83.12064
2 Freshman 85.55093
3 Freshman 82.49311
4 Freshman 89.78584
5 Freshman 85.98852
6 Freshman 82.53859

Pengambilan sampel bertingkat menggunakan jumlah baris

Kode berikut menunjukkan cara menggunakan fungsi group_by() dan sample_n() dari paket dplyr untuk mendapatkan sampel acak bertingkat sebanyak 40 siswa dengan total 10 siswa dari setiap kelas:

 library (dplyr)

#obtain laminated sample
strat_sample <- df %>%
                  group_by (grade) %>%
                  sample_n (size=10)

#find frequency of students from each grade
table(strat_sample$grade)

 Freshman Junior Senior Sophomore 
       10 10 10 10 

Pengambilan sampel bertingkat menggunakan pecahan baris

Kode berikut menunjukkan cara menggunakan fungsi group_by() dan sample_frac() dari paket dplyr untuk mendapatkan sampel acak bertingkat yang kemudian kita pilih secara acak 15% siswa di setiap kelas:

 library (dplyr)

#obtain laminated sample
strat_sample <- df %>%
                  group_by (grade) %>%
                  sample_frac (size=.15)

#find frequency of students from each grade
table(strat_sample$grade)

 Freshman Junior Senior Sophomore 
       15 15 15 15

Sumber daya tambahan

Jenis Metode Pengambilan Sampel
Pengambilan sampel cluster di R
Pengambilan sampel sistematis di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *