Повний посібник: як читати файли csv за допомогою pandas
Файли CSV (значення, розділені комами) є одним із найпоширеніших способів зберігання даних.
На щастя, функція pandas read_csv() дозволяє легко читати файли CSV у Python майже в будь-якому потрібному форматі.
Цей підручник пояснює кілька способів читання файлів CSV у Python за допомогою наступного файлу CSV під назвою «data.csv» :
playerID,team,points 1,Lakers,26 2,Mavs,19 3,Bucks,24 4,Spurs,22
Приклад 1: читайте файл CSV у DataFrame pandas
Наступний код показує, як читати файл CSV у pandas DataFrame:
#import CSV file as DataFrame df = pd. read_csv ('data.csv') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Приклад 2: читання певних стовпців із файлу CSV
Наступний код показує, як читати лише стовпці з позначками «playerID» і «points» із файлу CSV у pandas DataFrame:
#import only specific columns from CSV file df = pd. read_csv ('data.csv', usecols=[' playerID ',' points ']) #view DataFrame df playerID points 0 1 26 1 2 19 2 3 24 3 4 22
Ви також можете вказати індекси стовпців для читання в pandas DataFrame:
#import only specific columns from CSV file df = pd. read_csv (' data.csv ', usecols=[ 0,1 ]) #view DataFrame df playerID team 0 1 Lakers 1 2 Mavs 2 3 Bucks 3 4 Spurs
Приклад 3: укажіть рядок заголовка під час імпорту файлу CSV
У деяких випадках рядок заголовка може бути не першим у файлі CSV.
Наприклад, розглянемо такий файл CSV, у якому рядок заголовка фактично відображається у другому рядку:
random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22
Щоб прочитати цей CSV-файл у pandas DataFrame, ми можемо вказати header=1 наступним чином:
#import from CSV file and specify that header starts on second row df = pd. read_csv ('data.csv', header= 1 ) #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Приклад 4: пропускати рядки під час імпортування файлу CSV
Ви також можете легко пропускати рядки під час імпортування файлу CSV за допомогою аргументу skiprows .
Наприклад, наведений нижче код показує, як ігнорувати другий рядок під час імпортування файлу CSV:
#import from CSV file and skip second row df = pd. read_csv ('data.csv', skiprows=[ 1 ] ) #view DataFrame df playerID team points 0 2 Mavs 19 1 3 Bucks 24 2 4 Spurs 22
А наступний код показує, як ігнорувати другий і третій рядки під час імпортування файлу CSV:
#import from CSV file and skip second and third rows df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] ) #view DataFrame df playerID team points 1 3 Bucks 24 2 4 Spurs 22
Приклад 5: читання файлів CSV із спеціальним роздільником
Іноді у вас може бути файл CSV із роздільником, відмінним від коми.
Наприклад, припустімо, що наш файл CSV має підкреслення як роздільник:
playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22
Щоб прочитати цей файл CSV у pandas, ми можемо використати аргумент sep , щоб вказати роздільник, який використовуватиметься під час читання файлу:
#import from CSV file and specify delimiter to use df = pd. read_csv ('data.csv', sep=' _ ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання панди:
Як читати текстовий файл за допомогою Pandas
Як читати файли Excel за допомогою Pandas
Як читати файли TSV за допомогою Pandas
Як читати таблиці HTML за допомогою Pandas