Pandalar'da örnek veri kümelerine nasıl erişilir?
Farklı işlevleri oynamak ve pratik yapmak için genellikle pandalardaki örnek veri kümelerine erişmek isteyebilirsiniz.
Neyse ki yerleşik test işlevini kullanarak örnek panda veri kümeleri oluşturabilirsiniz.
Aşağıdaki örnekler bu özelliğin nasıl kullanılacağını göstermektedir.
Örnek 1: Tüm sayısal sütunları içeren bir Pandas veri kümesi oluşturun
Aşağıdaki kod, tüm sayısal sütunlarla pandalar veri kümesinin nasıl oluşturulacağını gösterir:
import pandas as pd
#create sample dataset
df1 = pd. util . testing . makeDataFrame ()
#view dimensions of dataset
print ( df1.shape )
(30, 4)
#view first five rows of dataset
print ( df1.head ())
ABCD
s8tpz0W5mF -0.751223 0.956338 -0.441847 0.695612
CXQ9YhLhk8 -0.210881 -0.231347 -0.227672 -0.616171
KAbcor6sQK 0.727880 0.128638 -0.989993 1.094069
IH3bptMpdb -1.599723 1.570162 -0.221688 2.194936
gar9ZxBTrH 0.025171 -0.446555 0.169873 -1.583553
Varsayılan olarak makeDataFrame() işlevi, tüm sütunların sayısal olduğu 30 satır ve 4 sütun içeren bir pandas DataFrame oluşturur.
Örnek 2: Karışık Sütunlarla Pandalar Veri Kümesi Oluşturma
Aşağıdaki kod, tüm sayısal sütunlarla pandalar veri kümesinin nasıl oluşturulacağını gösterir:
import pandas as pd
#create sample dataset
df2 = pd. util . testing . makeMixedDataFrame ()
#view dimensions of dataset
print ( df2.shape )
(5, 4)
#view first five rows of dataset
print ( df2.head ())
ABCD
0 0.0 0.0 foo1 2009-01-01
1 1.0 1.0 foo2 2009-01-02
2 2.0 0.0 foo3 2009-01-05
3 3.0 1.0 foo4 2009-01-06
4 4.0 0.0 foo5 2009-01-07
Varsayılan olarak makeMixedDataFrame() işlevi, sütunların çeşitli veri türleri olduğu 5 satır ve 4 sütun içeren bir pandas DataFrame oluşturur.
Her sütunun veri türünü görüntülemek için aşağıdaki kodu kullanabiliriz:
#display data type of each column
df2. dtypes
A float64
B float64
C object
D datetime64[ns]
dtype:object
Sonuçtan şunları görebiliriz:
- A Sütunu sayısaldır
- B sütunu sayısaldır
- C sütunu bir dizedir
- D sütunu bir tarihtir
Örnek 3: Eksik Değerlere Sahip Bir Pandas Veri Kümesi Oluşturma
Aşağıdaki kod, çeşitli sütunlarda eksik değerlere sahip bir panda veri kümesinin nasıl oluşturulacağını gösterir:
import pandas as pd
#create sample dataset
df3 = pd. util . testing . makeMissingDataFrame ()
#view dimensions of dataset
print ( df3.shape )
(30, 4)
#view first five rows of dataset
print ( df3.head ())
ABCD
YgAQaNaGfG 0.444376 -2.264920 1.117377 -0.087507
JoT4KxJeHd 1.913939 1.287006 -0.331315 -0.392949
tyrA2P6wz3 NaN 2.988521 0.399583 0.095831
1qvPc9DU1t 0.028716 1.311452 -0.237756 -0.150362
3aAXYtXjIO -1.069339 0.332067 0.204074 NaN
Varsayılan olarak makeMissingDataFrame() işlevi, farklı sütunlarda eksik değerlerin (NaN) bulunduğu 30 satır ve 4 sütundan oluşan bir pandas DataFrame oluşturur.
Bu özellik özellikle kullanışlıdır çünkü gerçek dünyadaki veri kümelerinde yaygın olan, eksik değerleri olan bir veri kümesiyle çalışmanıza olanak tanır.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Rastgele verilerle Pandas DataFrame nasıl oluşturulur
Pandalarda satırlar rastgele nasıl örneklenir?
Pandas DataFrame’de satırlar nasıl karıştırılır