Nihai kılavuz: pandalarla csv dosyaları nasıl okunur?
CSV (virgülle ayrılmış değer) dosyaları, verileri depolamanın en yaygın yollarından biridir.
Neyse ki, pandas read_csv() işlevi Python’daki CSV dosyalarını hemen hemen istediğiniz formatta kolayca okumanıza olanak tanır.
Bu eğitimde , “data.csv” adlı aşağıdaki CSV dosyasını kullanarak Python’da CSV dosyalarını okumanın birkaç yolu açıklanmaktadır:
playerID,team,points 1,Lakers,26 2,Mavs,19 3,Bucks,24 4,Spurs,22
Örnek 1: CSV dosyasını pandaların DataFrame’ine okuyun
Aşağıdaki kod, CSV dosyasının pandas DataFrame’e nasıl okunacağını gösterir:
#import CSV file as DataFrame df = pd. read_csv ('data.csv') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Örnek 2: CSV dosyasındaki belirli sütunları okuyun
Aşağıdaki kod, CSV dosyasından yalnızca “playerID” ve “points” etiketli sütunların pandas DataFrame’e nasıl okunacağını gösterir:
#import only specific columns from CSV file df = pd. read_csv ('data.csv', usecols=[' playerID ',' points ']) #view DataFrame df playerID points 0 1 26 1 2 19 2 3 24 3 4 22
Ayrıca bir pandanın DataFrame’inde okunacak sütun dizinlerini de belirleyebilirsiniz:
#import only specific columns from CSV file df = pd. read_csv (' data.csv ', usecols=[ 0,1 ]) #view DataFrame df playerID team 0 1 Lakers 1 2 Mavs 2 3 Bucks 3 4 Spurs
Örnek 3: CSV dosyasını içe aktarırken başlık satırını belirtin
Bazı durumlarda başlık satırı CSV dosyasındaki ilk satır olmayabilir.
Örneğin, başlık satırının aslında ikinci satırda göründüğü aşağıdaki CSV dosyasını düşünün:
random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22
Bu CSV dosyasını bir pandas DataFrame’e okumak için başlık=1’i aşağıdaki gibi belirtebiliriz:
#import from CSV file and specify that header starts on second row df = pd. read_csv ('data.csv', header= 1 ) #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Örnek 4: CSV dosyasını içe aktarırken satırları atlayın
Ayrıca bir CSV dosyasını içe aktarırken skiprows bağımsız değişkenini kullanarak satırları kolayca atlayabilirsiniz.
Örneğin, aşağıdaki kod CSV dosyasını içe aktarırken ikinci satırın nasıl yok sayılacağını gösterir:
#import from CSV file and skip second row df = pd. read_csv ('data.csv', skiprows=[ 1 ] ) #view DataFrame df playerID team points 0 2 Mavs 19 1 3 Bucks 24 2 4 Spurs 22
Aşağıdaki kod, CSV dosyasını içe aktarırken ikinci ve üçüncü satırların nasıl yok sayılacağını gösterir:
#import from CSV file and skip second and third rows df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] ) #view DataFrame df playerID team points 1 3 Bucks 24 2 4 Spurs 22
Örnek 5: CSV dosyalarını özel bir sınırlayıcıyla okuyun
Bazen virgül dışında bir sınırlayıcıya sahip bir CSV dosyanız olabilir.
Örneğin, CSV dosyamızın sınırlayıcı olarak bir alt çizgiye sahip olduğunu varsayalım:
playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22
Bu CSV dosyasını pandalara okumak için, dosyayı okurken kullanılacak sınırlayıcıyı belirtmek amacıyla sep argümanını kullanabiliriz:
#import from CSV file and specify delimiter to use df = pd. read_csv ('data.csv', sep=' _ ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Ek kaynaklar
Aşağıdaki eğitimlerde diğer yaygın panda görevlerinin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalar ile bir metin dosyası nasıl okunur
Pandalar ile Excel dosyaları nasıl okunur
Pandalarla TSV dosyaları nasıl okunur
Pandalarla HTML tabloları nasıl okunur?