Pandalar: değiştirilerek satırlar nasıl örneklenir?
Bir DataFrame’deki satırları değiştirilerek rastgele örneklemek için pandas sample() işlevindeki change=True bağımsız değişkenini kullanabilirsiniz:
#randomly select n rows with repeats allowed df. sample (n= 5 , replace= True )
change=True komutunu kullanarak aynı satırın örneğe birden çok kez dahil edilmesine izin verirsiniz.
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: Pandalarda değiştirilen satır örnekleri
Çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki pandalar DataFrame’e sahip olduğumuzu varsayalım:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
Bir satır örneğini rastgele seçmek için sample() işlevini kullandığımızı varsayalım:
#randomly select 6 rows from DataFrame (without replacement) df. sample (n= 6 , random_state= 0 ) team points assists rebounds 6 G 20 9 9 2 C 19 7 10 1 B 22 7 8 7:28 4 12 3 D 14 9 6 0 A 18 5 11
DataFrame’de altı satırın seçildiğini ve satırlardan hiçbirinin örnekte birden çok kez görünmediğini unutmayın.
Not : random_state=0 argümanı bu örneğin tekrarlanabilir olmasını sağlar.
Şimdi değiştirilecek satırların rastgele bir örneğini seçmek için change=True argümanını kullandığımızı varsayalım:
#randomly select 6 rows from DataFrame (with replacement) df. sample (n= 6 , replace= True , random_state= 0 ) team points assists rebounds 4 E 14 12 6 7:28 4 12 5 F 11 9 5 0 A 18 5 11 3 D 14 9 6 3 D 14 9 6
“D” takımının bulunduğu satırın birden çok kez göründüğünü unutmayın.
change=True argümanını kullanarak aynı satırın örnekte birden çok kez görünmesine izin veririz.
Ayrıca, frac argümanını kullanarak örneğe dahil etmek için DataFrame’in rastgele bir kısmını seçebileceğimizi unutmayın.
Örneğin, aşağıdaki örnek, değiştirme örneğine dahil edilecek satırların %75’inin nasıl seçileceğini gösterir:
#randomly select 75% of rows (with replacement) df. sample (frac= 0.75 , replace= True , random_state= 0 ) team points assists rebounds 4 E 14 12 6 7:28 4 12 5 F 11 9 5 0 A 18 5 11 3 D 14 9 6 3 D 14 9 6
Çizgi sayısının %75’inin (8 üzerinden 6) örneğe dahil edildiğini ve çizgilerden en az birinin (“D” takımıyla) örnekte iki kez göründüğünü unutmayın.
Not : Pandas sample() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde Pandalarda diğer yaygın örnekleme yöntemlerinin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalarda tabakalı örnekleme nasıl yapılır?
Pandalarda küme örneklemesi nasıl gerçekleştirilir?