Pandalarda küme örneklemesi: örneklerle


Araştırmacılar genellikle bir popülasyondanörnekler alır ve bu örnekteki verileri, bir bütün olarak popülasyon hakkında sonuçlar çıkarmak için kullanır.

Yaygın olarak kullanılan bir örnekleme yöntemi, bir popülasyonun kümelere bölündüğü ve belirli kümelerin tüm üyelerinin örneğe dahil edilmek üzere seçildiği küme örneklemesidir .

Bu eğitimde Python’da bir panda DataFrame’de küme örneklemesinin nasıl gerçekleştirileceği açıklanmaktadır.

Örnek: Pandalarda Küme Örneklemesi

Diyelim ki şehir turu sunan bir firma müşterilerine anket yapmak istiyor. Günde sundukları on turdan rastgele dördünü seçiyorlar ve her müşteriden deneyimlerini 1’den 10’a kadar derecelendirmelerini istiyorlar.

Aşağıdaki kod, çalışmak üzere bir pandas DataFrame’in nasıl oluşturulacağını gösterir:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (0)

#createDataFrame
df = pd.DataFrame({'tour': np. repeat (np. arange (1,11), 20),
                   'experience': np. random . normal (loc=7, scale=1, size=200)})

#view first six rows of DataFrame
df. head ()

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

Aşağıdaki kod, dört ziyareti rastgele seçerek ve bu ziyaretlerin her bir üyesini numuneye dahil ederek bir müşteri numunesinin nasıl elde edileceğini gösterir:

 #randomly choose 4 tour groups out of the 10
clusters = np. random . choice (np. arange (1,11), size=4, replace= False )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample = df[df[' tour ']. isin (clusters)]

#view first six rows of sample
cluster_sample. head ()

tour experience
40 3 5.951447
41 3 5.579982
42 3 5.293730
43 3 8.950775
44 3 6.490348 

#find how many observations came from each tour group
cluster_sample[' tour ']. value_counts ()

10 20
6 20
5 20
3 20
Name: tour, dtype: int64

Sonuçtan şunu görebiliriz:

  • Örneklemeye 10 numaralı tur grubundan 20 müşteri dahil edildi.
  • Örneklemeye 6 numaralı turist grubundan 20 müşteri dahil edildi.
  • Örneklemeye 5 numaralı turist grubundan 20 müşteri dahil edildi.
  • Örneklemeye 3 numaralı turist grubundan 20 müşteri dahil edildi.

Böylece bu örneklem 4 farklı turist grubundan toplam 80 müşteriden oluşmaktadır.

Ek kaynaklar

Farklı örnekleme yöntemlerinin anlaşılması
Pandalarda tabakalı örnekleme
Pandaların sistematik örneklenmesi

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir