Как прочитать csv-файл из строки в pandas dataframe
Вы можете использовать следующий базовый синтаксис для чтения CSV-файла из строки в DataFrame pandas:
import pandas as pd import io df = pd. read_csv ( io.StringIO (some_string), sep=" , ")
Следующие примеры показывают, как использовать этот синтаксис на практике.
Пример 1. Чтение файла CSV из строки с запятыми в качестве разделителей.
Следующий код показывает, как прочитать CSV-файл из строки (с запятыми в качестве разделителей) в DataFrame pandas:
import pandas as pd import io some_string="""team,points,rebounds A,22,10 B,14.9 C,29.6 D,30.2 E,22.9 F,31.10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" , ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Полученный DataFrame pandas содержит значения из CSV-строки.
Пример 2. Чтение CSV-файла из строки с точкой с запятой в качестве разделителя.
Следующий код показывает, как прочитать CSV-файл из строки (с точками с запятой в качестве разделителей) в DataFrame pandas:
import pandas as pd import io some_string="""team;points;rebounds A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" ; ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Полученный DataFrame pandas содержит значения из CSV-строки.
Пример 3. Чтение CSV-файла из строки без заголовка.
Следующий код показывает, как прочитать CSV-файл из строки (без строки заголовка) в DataFrame pandas:
import pandas as pd import io some_string="""A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Используя аргумент header=None , мы сказали pandas не использовать первую строку в качестве строки заголовка.
По умолчанию pandas использует диапазон числовых значений (0, 1, 2) в качестве имен столбцов DataFrame.
Примечание . Полную документацию по функции pandas read_csv() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:
Pandas: как пропускать строки при чтении файла CSV
Pandas: как добавить данные в существующий файл CSV
Pandas: как прочитать CSV-файл без заголовка
Pandas: задайте имена столбцов при импорте файла CSV