R'de sistematik örnekleme (örneklerle)


Araştırmacılar genellikle bir popülasyondanörnekler alır ve bu örnekteki verileri, bir bütün olarak popülasyon hakkında sonuçlar çıkarmak için kullanır.

Yaygın olarak kullanılan bir örnekleme yöntemi, iki aşamalı basit bir süreçte uygulanan sistematik örneklemedir :

1. Bir popülasyonun her üyesini belirli bir sıraya yerleştirin.

2. Rastgele bir başlangıç noktası seçin ve numunenin parçası olacak n üyeden birini seçin.

Bu eğitimde R’de sistematik örneklemenin nasıl gerçekleştirileceği açıklanmaktadır.

Örnek: R’de sistematik örnekleme

Bir müdürün toplam 500 öğrencisi olan bir okuldan 100 öğrencilik bir örneklem almak istediğini varsayalım. Her öğrenciyi soyadına göre alfabetik sıraya koyduğu, rastgele bir başlangıç noktası seçtiği ve her beş öğrenciden birinin örneklemde yer aldığı sistematik örneklemeyi kullanmayı tercih ediyor.

Aşağıdaki kod, R’de çalışmak üzere sahte bir veri çerçevesinin nasıl oluşturulacağını gösterir:

 #make this example reproducible
set.seed(1)

#create simple function to generate random last names
randomNames <- function (n = 5000) {
  do.call(paste0, replicate(5, sample(LETTERS, n, TRUE), FALSE))
}

#create data frame
df <- data.frame(last_name = randomNames(500),
                 gpa = rnorm(500, mean=82, sd=3))

#view first six rows of data frame
head(df)

  last_name gpa
1 GONBW 82.19580
2 JRRWZ 85.10598
3 ORJFW 88.78065
4 XRYNL 85.94409
5 FMDCE 79.38993
6 XZBJC 80.49061

Aşağıdaki kod, sistematik örnekleme yoluyla 100 öğrenciden oluşan bir örneklemin nasıl elde edileceğini gösterir:

 #define function to obtain systematic sample
obtain_sys = function (N,n){
  k = ceiling(N/n)
  r = sample(1:k, 1)
  seq(r, r + k*(n-1), k)
}

#obtain systematic sample
sys_sample_df = df[obtain_sys( nrow (df), 100), ]

#view first six rows of data frame
head(sys_sample_df)

   last_name gpa
3 ORJFW 88.78065
8 RWPSB 81.96988
13 RACZU 79.21433
18 ZOHKA 80.47246
23 QJETK 87.09991
28 JTHWB 83.87300

#view dimensions of data frame
dim(sys_sample_df)

[1] 100 2

Örneğe dahil edilen ilk üyenin orijinal veri çerçevesinin 3. satırında olduğunu unutmayın. Numunenin her bir sonraki üyesi, önceki üyeden 5 satır sonra yer alır.

Ve dim() kullanarak elde ettiğimiz sistematik örneğin 100 satır ve 2 sütundan oluşan bir veri çerçevesi olduğunu görebiliriz.

Ek kaynaklar

Örnekleme Yöntemi Türleri
R’de katmanlı örnekleme
R’de küme örneklemesi

Yorum ekle

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir