Clusterbemonstering in r: met voorbeelden
Onderzoekers nemen vaak steekproeven uit een populatie en gebruiken de gegevens uit de steekproef om conclusies te trekken over de populatie als geheel.
Een veelgebruikte bemonsteringsmethode is clusterbemonstering , waarbij een populatie in clusters wordt verdeeld en alle leden van bepaalde clusters worden gekozen om in de steekproef te worden opgenomen.
In deze zelfstudie wordt uitgelegd hoe u clusterbemonstering uitvoert in R.
Voorbeeld: Clusterbemonstering in R
Stel dat een bedrijf dat rondleidingen door de stad aanbiedt, een enquête wil houden onder zijn klanten. Uit de tien tours die ze per dag aanbieden, selecteren ze willekeurig vier tours en vragen ze elke klant om zijn ervaring te beoordelen op een schaal van 1 tot 10.
De volgende code laat zien hoe u een nepdataframe in R kunt maken om mee te werken:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)) #view first six rows of data frame head(df) tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
En de volgende code laat zien hoe u een steekproef van klanten kunt verkrijgen door willekeurig vier bezoeken te selecteren en elk lid van die bezoeken in de steekproef op te nemen:
#randomly choose 4 tour groups out of the 10 clusters <- sample( unique (df$tour), size=4, replace= F ) #define sample as all members who belong to one of the 4 tour groups cluster_sample <- df[df$tour %in% clusters, ] #view how many customers came from each tour table(cluster_sample$tour) 2 7 8 10 20 20 20 20
Uit het resultaat kunnen we zien dat:
- In de steekproef waren 20 klanten van toeristengroep nr. 2 opgenomen.
- In de steekproef waren 20 klanten van reisgroep #7 opgenomen.
- In de steekproef waren 20 klanten van reisgroep #8 opgenomen.
- In de steekproef waren 20 klanten van reisgroep #10 opgenomen.
Deze steekproef bestaat dus uit in totaal 80 klanten uit 4 verschillende toeristische groepen.
Gerelateerd: Hoe de %in% operator in R te gebruiken
Aanvullende bronnen
Inzicht in de verschillende soorten bemonsteringsmethoden
Gestratificeerde bemonstering in R
Systematische bemonstering in R