Como ler um arquivo csv de uma string no pandas dataframe
Você pode usar a seguinte sintaxe básica para ler um arquivo CSV de uma string em um DataFrame do pandas:
import pandas as pd import io df = pd. read_csv ( io.StringIO (some_string), sep=" , ")
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: Leia um arquivo CSV de uma string com vírgulas como separadores
O código a seguir mostra como ler um arquivo CSV de uma string (com vírgulas como separadores) em um DataFrame do pandas:
import pandas as pd import io some_string="""team,points,rebounds A,22,10 B,14.9 C,29.6 D,30.2 E,22.9 F,31.10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" , ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
O DataFrame do pandas resultante contém os valores da string CSV.
Exemplo 2: Leia um arquivo CSV de uma string com ponto e vírgula como separador
O código a seguir mostra como ler um arquivo CSV de uma string (com ponto e vírgula como separadores) em um DataFrame do pandas:
import pandas as pd import io some_string="""team;points;rebounds A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv ( io.StringIO (some_string), sep=" ; ") #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
O DataFrame do pandas resultante contém os valores da string CSV.
Exemplo 3: Ler um arquivo CSV de uma string sem cabeçalho
O código a seguir mostra como ler um arquivo CSV de uma string (sem uma linha de cabeçalho) em um DataFrame do pandas:
import pandas as pd import io some_string="""A;22;10 B;14;9 C;29;6 D;30;2 E;22;9 F;31;10""" #read CSV string into pandas DataFrame df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Usando o argumento header=None , dissemos aos pandas para não usarem a primeira linha como linha de cabeçalho.
Por padrão, o pandas usa um intervalo de valores numéricos (0, 1, 2) como nomes de colunas para o DataFrame.
Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:
Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: Como ler um arquivo CSV sem cabeçalho
Pandas: defina nomes de colunas ao importar um arquivo CSV