Nihai kılavuz: pandalarla csv dosyaları nasıl okunur?


CSV (virgülle ayrılmış değer) dosyaları, verileri depolamanın en yaygın yollarından biridir.

Neyse ki, pandas read_csv() işlevi Python’daki CSV dosyalarını hemen hemen istediğiniz formatta kolayca okumanıza olanak tanır.

Bu eğitimde , “data.csv” adlı aşağıdaki CSV dosyasını kullanarak Python’da CSV dosyalarını okumanın birkaç yolu açıklanmaktadır:

 playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Örnek 1: CSV dosyasını pandaların DataFrame’ine okuyun

Aşağıdaki kod, CSV dosyasının pandas DataFrame’e nasıl okunacağını gösterir:

 #import CSV file as DataFrame
df = pd. read_csv ('data.csv')

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Örnek 2: CSV dosyasındaki belirli sütunları okuyun

Aşağıdaki kod, CSV dosyasından yalnızca “playerID” ve “points” etiketli sütunların pandas DataFrame’e nasıl okunacağını gösterir:

 #import only specific columns from CSV file
df = pd. read_csv ('data.csv', usecols=[' playerID ',' points '])

#view DataFrame
df

	playerID points
0 1 26
1 2 19
2 3 24
3 4 22

Ayrıca bir pandanın DataFrame’inde okunacak sütun dizinlerini de belirleyebilirsiniz:

 #import only specific columns from CSV file
df = pd. read_csv (' data.csv ', usecols=[ 0,1 ])

#view DataFrame
df

        playerID team
0 1 Lakers
1 2 Mavs
2 3 Bucks
3 4 Spurs

Örnek 3: CSV dosyasını içe aktarırken başlık satırını belirtin

Bazı durumlarda başlık satırı CSV dosyasındaki ilk satır olmayabilir.

Örneğin, başlık satırının aslında ikinci satırda göründüğü aşağıdaki CSV dosyasını düşünün:

 random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Bu CSV dosyasını bir pandas DataFrame’e okumak için başlık=1’i aşağıdaki gibi belirtebiliriz:

 #import from CSV file and specify that header starts on second row
df = pd. read_csv ('data.csv', header= 1 )

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Örnek 4: CSV dosyasını içe aktarırken satırları atlayın

Ayrıca bir CSV dosyasını içe aktarırken skiprows bağımsız değişkenini kullanarak satırları kolayca atlayabilirsiniz.

Örneğin, aşağıdaki kod CSV dosyasını içe aktarırken ikinci satırın nasıl yok sayılacağını gösterir:

 #import from CSV file and skip second row
df = pd. read_csv ('data.csv', skiprows=[ 1 ] )

#view DataFrame
df

        playerID team points
0 2 Mavs 19
1 3 Bucks 24
2 4 Spurs 22

Aşağıdaki kod, CSV dosyasını içe aktarırken ikinci ve üçüncü satırların nasıl yok sayılacağını gösterir:

 #import from CSV file and skip second and third rows
df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] )

#view DataFrame
df

        playerID team points
1 3 Bucks 24
2 4 Spurs 22

Örnek 5: CSV dosyalarını özel bir sınırlayıcıyla okuyun

Bazen virgül dışında bir sınırlayıcıya sahip bir CSV dosyanız olabilir.

Örneğin, CSV dosyamızın sınırlayıcı olarak bir alt çizgiye sahip olduğunu varsayalım:

 playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

Bu CSV dosyasını pandalara okumak için, dosyayı okurken kullanılacak sınırlayıcıyı belirtmek amacıyla sep argümanını kullanabiliriz:

 #import from CSV file and specify delimiter to use
df = pd. read_csv ('data.csv', sep=' _ ')

#view DataFrame
df

	playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Ek kaynaklar

Aşağıdaki eğitimlerde diğer yaygın panda görevlerinin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalar ile bir metin dosyası nasıl okunur
Pandalar ile Excel dosyaları nasıl okunur
Pandalarla TSV dosyaları nasıl okunur
Pandalarla HTML tabloları nasıl okunur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir