Amostragem de cluster em r: com exemplos
Os pesquisadores geralmente coletam amostras de uma população e usam os dados da amostra para tirar conclusões sobre a população como um todo.
Um método de amostragem comumente usado é a amostragem por conglomerados , em que uma população é dividida em conglomerados e todos os membros de determinados conglomerados são escolhidos para inclusão na amostra.
Este tutorial explica como realizar amostragem por cluster em R.
Exemplo: Amostragem Cluster em R
Digamos que uma empresa que oferece passeios pela cidade queira fazer uma pesquisa com seus clientes. Dos dez passeios que oferecem por dia, eles selecionam aleatoriamente quatro passeios e pedem a cada cliente que avalie sua experiência em uma escala de 1 a 10.
O código a seguir mostra como criar um quadro de dados falso em R para trabalhar:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)) #view first six rows of data frame head(df) tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
E o código a seguir mostra como obter uma amostra de clientes selecionando aleatoriamente quatro visitas e incluindo cada membro dessas visitas na amostra:
#randomly choose 4 tour groups out of the 10 clusters <- sample( unique (df$tour), size=4, replace= F ) #define sample as all members who belong to one of the 4 tour groups cluster_sample <- df[df$tour %in% clusters, ] #view how many customers came from each tour table(cluster_sample$tour) 2 7 8 10 20 20 20 20
Pelo resultado podemos ver que:
- Foram incluídos na amostra 20 clientes do grupo turístico #2.
- 20 clientes do grupo turístico nº 7 foram incluídos na amostra.
- 20 clientes do grupo turístico nº 8 foram incluídos na amostra.
- 20 clientes do grupo turístico nº 10 foram incluídos na amostra.
Assim, esta amostra é composta por 80 clientes no total de 4 grupos turísticos diferentes.
Relacionado: Como usar o operador% in% em R
Recursos adicionais
Compreender os diferentes tipos de métodos de amostragem
Amostragem estratificada em R
Amostragem sistemática em R