Amostragem de cluster em r: com exemplos


Os pesquisadores geralmente coletam amostras de uma população e usam os dados da amostra para tirar conclusões sobre a população como um todo.

Um método de amostragem comumente usado é a amostragem por conglomerados , em que uma população é dividida em conglomerados e todos os membros de determinados conglomerados são escolhidos para inclusão na amostra.

Este tutorial explica como realizar amostragem por cluster em R.

Exemplo: Amostragem Cluster em R

Digamos que uma empresa que oferece passeios pela cidade queira fazer uma pesquisa com seus clientes. Dos dez passeios que oferecem por dia, eles selecionam aleatoriamente quatro passeios e pedem a cada cliente que avalie sua experiência em uma escala de 1 a 10.

O código a seguir mostra como criar um quadro de dados falso em R para trabalhar:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#view first six rows of data frame
head(df)

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

E o código a seguir mostra como obter uma amostra de clientes selecionando aleatoriamente quatro visitas e incluindo cada membro dessas visitas na amostra:

 #randomly choose 4 tour groups out of the 10
clusters <- sample( unique (df$tour), size=4, replace= F )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters, ]

#view how many customers came from each tour
table(cluster_sample$tour)

 2 7 8 10 
20 20 20 20 

Pelo resultado podemos ver que:

  • Foram incluídos na amostra 20 clientes do grupo turístico #2.
  • 20 clientes do grupo turístico nº 7 foram incluídos na amostra.
  • 20 clientes do grupo turístico nº 8 foram incluídos na amostra.
  • 20 clientes do grupo turístico nº 10 foram incluídos na amostra.

Assim, esta amostra é composta por 80 clientes no total de 4 grupos turísticos diferentes.

Relacionado: Como usar o operador% in% em R

Recursos adicionais

Compreender os diferentes tipos de métodos de amostragem
Amostragem estratificada em R
Amostragem sistemática em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *