Pandalarda küme örneklemesi: örneklerle
Araştırmacılar genellikle bir popülasyondanörnekler alır ve bu örnekteki verileri, bir bütün olarak popülasyon hakkında sonuçlar çıkarmak için kullanır.
Yaygın olarak kullanılan bir örnekleme yöntemi, bir popülasyonun kümelere bölündüğü ve belirli kümelerin tüm üyelerinin örneğe dahil edilmek üzere seçildiği küme örneklemesidir .
Bu eğitimde Python’da bir panda DataFrame’de küme örneklemesinin nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: Pandalarda Küme Örneklemesi
Diyelim ki şehir turu sunan bir firma müşterilerine anket yapmak istiyor. Günde sundukları on turdan rastgele dördünü seçiyorlar ve her müşteriden deneyimlerini 1’den 10’a kadar derecelendirmelerini istiyorlar.
Aşağıdaki kod, çalışmak üzere bir pandas DataFrame’in nasıl oluşturulacağını gösterir:
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (0) #createDataFrame df = pd.DataFrame({'tour': np. repeat (np. arange (1,11), 20), 'experience': np. random . normal (loc=7, scale=1, size=200)}) #view first six rows of DataFrame df. head () tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
Aşağıdaki kod, dört ziyareti rastgele seçerek ve bu ziyaretlerin her bir üyesini numuneye dahil ederek bir müşteri numunesinin nasıl elde edileceğini gösterir:
#randomly choose 4 tour groups out of the 10 clusters = np. random . choice (np. arange (1,11), size=4, replace= False ) #define sample as all members who belong to one of the 4 tour groups cluster_sample = df[df[' tour ']. isin (clusters)] #view first six rows of sample cluster_sample. head () tour experience 40 3 5.951447 41 3 5.579982 42 3 5.293730 43 3 8.950775 44 3 6.490348 #find how many observations came from each tour group cluster_sample[' tour ']. value_counts () 10 20 6 20 5 20 3 20 Name: tour, dtype: int64
Sonuçtan şunu görebiliriz:
- Örneklemeye 10 numaralı tur grubundan 20 müşteri dahil edildi.
- Örneklemeye 6 numaralı turist grubundan 20 müşteri dahil edildi.
- Örneklemeye 5 numaralı turist grubundan 20 müşteri dahil edildi.
- Örneklemeye 3 numaralı turist grubundan 20 müşteri dahil edildi.
Böylece bu örneklem 4 farklı turist grubundan toplam 80 müşteriden oluşmaktadır.
Ek kaynaklar
Farklı örnekleme yöntemlerinin anlaşılması
Pandalarda tabakalı örnekleme
Pandaların sistematik örneklenmesi