Próbkowanie klastrów w r: z przykładami


Naukowcy często pobierają próbki z populacji i wykorzystują dane z próbki do wyciągania wniosków na temat populacji jako całości.

Powszechnie stosowaną metodą próbkowania jest próbkowanie klastrów , podczas którego populacja jest dzielona na skupienia, a do włączenia do próby wybierani są wszyscy członkowie określonych skupień.

W tym samouczku wyjaśniono, jak wykonać próbkowanie klastrów w języku R.

Przykład: próbkowanie klastrów w R

Załóżmy, że firma oferująca wycieczki po mieście chce przeprowadzić ankietę wśród swoich klientów. Spośród dziesięciu wycieczek, które oferują dziennie, losowo wybierają cztery wycieczki i proszą każdego klienta o ocenę swoich wrażeń w skali od 1 do 10.

Poniższy kod pokazuje, jak utworzyć fałszywą ramkę danych w R, z którą można pracować:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#view first six rows of data frame
head(df)

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

Poniższy kod pokazuje, jak uzyskać próbkę klientów, wybierając losowo cztery wizyty i włączając do próby każdego uczestnika tych wizyt:

 #randomly choose 4 tour groups out of the 10
clusters <- sample( unique (df$tour), size=4, replace= F )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters, ]

#view how many customers came from each tour
table(cluster_sample$tour)

 2 7 8 10 
20 20 20 20 

Z wyniku możemy zobaczyć, że:

  • Do próby włączono 20 klientów z grupy turystycznej nr 2.
  • Do próby włączono 20 klientów z grupy wycieczkowej nr 7.
  • Do próby włączono 20 klientów z grupy wycieczkowej nr 8.
  • Do próby włączono 20 klientów z grupy wycieczkowej nr 10.

Zatem próba ta składa się łącznie z 80 klientów z 4 różnych grup turystycznych.

Powiązane: Jak używać operatora %in% w R

Dodatkowe zasoby

Zrozumienie różnych typów metod pobierania próbek
Próbkowanie warstwowe w R
Systematyczne pobieranie próbek w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *