Próbkowanie klastrów w r: z przykładami
Naukowcy często pobierają próbki z populacji i wykorzystują dane z próbki do wyciągania wniosków na temat populacji jako całości.
Powszechnie stosowaną metodą próbkowania jest próbkowanie klastrów , podczas którego populacja jest dzielona na skupienia, a do włączenia do próby wybierani są wszyscy członkowie określonych skupień.
W tym samouczku wyjaśniono, jak wykonać próbkowanie klastrów w języku R.
Przykład: próbkowanie klastrów w R
Załóżmy, że firma oferująca wycieczki po mieście chce przeprowadzić ankietę wśród swoich klientów. Spośród dziesięciu wycieczek, które oferują dziennie, losowo wybierają cztery wycieczki i proszą każdego klienta o ocenę swoich wrażeń w skali od 1 do 10.
Poniższy kod pokazuje, jak utworzyć fałszywą ramkę danych w R, z którą można pracować:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)) #view first six rows of data frame head(df) tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
Poniższy kod pokazuje, jak uzyskać próbkę klientów, wybierając losowo cztery wizyty i włączając do próby każdego uczestnika tych wizyt:
#randomly choose 4 tour groups out of the 10 clusters <- sample( unique (df$tour), size=4, replace= F ) #define sample as all members who belong to one of the 4 tour groups cluster_sample <- df[df$tour %in% clusters, ] #view how many customers came from each tour table(cluster_sample$tour) 2 7 8 10 20 20 20 20
Z wyniku możemy zobaczyć, że:
- Do próby włączono 20 klientów z grupy turystycznej nr 2.
- Do próby włączono 20 klientów z grupy wycieczkowej nr 7.
- Do próby włączono 20 klientów z grupy wycieczkowej nr 8.
- Do próby włączono 20 klientów z grupy wycieczkowej nr 10.
Zatem próba ta składa się łącznie z 80 klientów z 4 różnych grup turystycznych.
Powiązane: Jak używać operatora %in% w R
Dodatkowe zasoby
Zrozumienie różnych typów metod pobierania próbek
Próbkowanie warstwowe w R
Systematyczne pobieranie próbek w R