Повний посібник: як читати файли csv за допомогою pandas


Файли CSV (значення, розділені комами) є одним із найпоширеніших способів зберігання даних.

На щастя, функція pandas read_csv() дозволяє легко читати файли CSV у Python майже в будь-якому потрібному форматі.

Цей підручник пояснює кілька способів читання файлів CSV у Python за допомогою наступного файлу CSV під назвою «data.csv» :

 playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Приклад 1: читайте файл CSV у DataFrame pandas

Наступний код показує, як читати файл CSV у pandas DataFrame:

 #import CSV file as DataFrame
df = pd. read_csv ('data.csv')

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Приклад 2: читання певних стовпців із файлу CSV

Наступний код показує, як читати лише стовпці з позначками «playerID» і «points» із файлу CSV у pandas DataFrame:

 #import only specific columns from CSV file
df = pd. read_csv ('data.csv', usecols=[' playerID ',' points '])

#view DataFrame
df

	playerID points
0 1 26
1 2 19
2 3 24
3 4 22

Ви також можете вказати індекси стовпців для читання в pandas DataFrame:

 #import only specific columns from CSV file
df = pd. read_csv (' data.csv ', usecols=[ 0,1 ])

#view DataFrame
df

        playerID team
0 1 Lakers
1 2 Mavs
2 3 Bucks
3 4 Spurs

Приклад 3: укажіть рядок заголовка під час імпорту файлу CSV

У деяких випадках рядок заголовка може бути не першим у файлі CSV.

Наприклад, розглянемо такий файл CSV, у якому рядок заголовка фактично відображається у другому рядку:

 random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Щоб прочитати цей CSV-файл у pandas DataFrame, ми можемо вказати header=1 наступним чином:

 #import from CSV file and specify that header starts on second row
df = pd. read_csv ('data.csv', header= 1 )

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Приклад 4: пропускати рядки під час імпортування файлу CSV

Ви також можете легко пропускати рядки під час імпортування файлу CSV за допомогою аргументу skiprows .

Наприклад, наведений нижче код показує, як ігнорувати другий рядок під час імпортування файлу CSV:

 #import from CSV file and skip second row
df = pd. read_csv ('data.csv', skiprows=[ 1 ] )

#view DataFrame
df

        playerID team points
0 2 Mavs 19
1 3 Bucks 24
2 4 Spurs 22

А наступний код показує, як ігнорувати другий і третій рядки під час імпортування файлу CSV:

 #import from CSV file and skip second and third rows
df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] )

#view DataFrame
df

        playerID team points
1 3 Bucks 24
2 4 Spurs 22

Приклад 5: читання файлів CSV із спеціальним роздільником

Іноді у вас може бути файл CSV із роздільником, відмінним від коми.

Наприклад, припустімо, що наш файл CSV має підкреслення як роздільник:

 playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

Щоб прочитати цей файл CSV у pandas, ми можемо використати аргумент sep , щоб вказати роздільник, який використовуватиметься під час читання файлу:

 #import from CSV file and specify delimiter to use
df = pd. read_csv ('data.csv', sep=' _ ')

#view DataFrame
df

	playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання панди:

Як читати текстовий файл за допомогою Pandas
Як читати файли Excel за допомогою Pandas
Як читати файли TSV за допомогою Pandas
Як читати таблиці HTML за допомогою Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *