Pandalarda sistematik örnekleme (örneklerle)
Araştırmacılar genellikle bir popülasyondanörnekler alır ve bu örnekteki verileri, bir bütün olarak popülasyon hakkında sonuçlar çıkarmak için kullanır.
Yaygın olarak kullanılan bir örnekleme yöntemi, iki aşamalı basit bir süreçte uygulanan sistematik örneklemedir :
1. Bir popülasyonun her üyesini belirli bir sıraya yerleştirin.
2. Rastgele bir başlangıç noktası seçin ve numunenin parçası olacak n üyeden birini seçin.
Bu eğitimde Python’da bir panda DataFrame’inde sistematik örneklemenin nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: pandalar arasında sistematik örnekleme
Bir öğretmenin toplam 500 öğrencisi olan bir okuldan 100 öğrencilik bir örneklem elde etmek istediğini varsayalım. Her öğrenciyi soyadına göre alfabetik sıraya koyduğu, rastgele bir başlangıç noktası seçtiği ve her beş öğrenciden birinin örneklemde yer aldığı sistematik örneklemeyi kullanmayı tercih ediyor.
Aşağıdaki kod Python’da çalışmak üzere sahte bir veri çerçevesinin nasıl oluşturulacağını gösterir:
import pandas as pd import numpy as np import string import random #make this example reproducible n.p. random . seeds (0) #create simple function to generate random last names def randomNames(size=6, chars=string. ascii_uppercase ): return ''. join (random. choice (chars) for _ in range(size)) #createDataFrame df = pd.DataFrame({'last_name': [randomNames() for _ in range(500)], 'GPA': np. random . normal (loc=85, scale=3, size=500)}) #view first six rows of DataFrame df. head () last_name GPA 0 PXGPIV 86.667888 1 JKRRQI 87.677422 2 TRIZTC 83.733056 3 YHUGIN 85.314142 4 ZVUNVK 85.684160
Aşağıdaki kod, sistematik örnekleme yoluyla 100 öğrenciden oluşan bir örneklemin nasıl elde edileceğini gösterir:
#obtain systematic sample by selecting every 5th row sys_sample_df = df. iloc [::5] #view first six rows of DataFrame sys_sample_df. head () last_name gpa 3 ORJFW 88.78065 8 RWPSB 81.96988 13 RACZU 79.21433 18 ZOHKA 80.47246 23 QJETK 87.09991 28 JTHWB 83.87300 #view dimensions of data frame sys_sample_df. shape (100, 2)
Örneğe dahil edilen ilk üyenin orijinal veri çerçevesinin ilk satırında olduğunu unutmayın. Numunenin her bir sonraki üyesi, önceki üyeden 5 satır sonra yer alır.
Shape()’ i kullanarak elde ettiğimiz sistematik örneğin 100 satır ve 2 sütundan oluşan bir veri çerçevesi olduğunu görebiliriz.
Ek kaynaklar
Örnekleme Yöntemi Türleri
Pandalarda küme örneklemesi
Pandalarda tabakalı örnekleme