Como ler um arquivo csv de uma string no pandas dataframe


Você pode usar a seguinte sintaxe básica para ler um arquivo CSV de uma string em um DataFrame do pandas:

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

Os exemplos a seguir mostram como usar essa sintaxe na prática.

Exemplo 1: Leia um arquivo CSV de uma string com vírgulas como separadores

O código a seguir mostra como ler um arquivo CSV de uma string (com vírgulas como separadores) em um DataFrame do pandas:

 import pandas as pd
import io   

some_string="""team,points,rebounds
A,22,10
B,14.9
C,29.6
D,30.2
E,22.9
F,31.10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" , ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

O DataFrame do pandas resultante contém os valores da string CSV.

Exemplo 2: Leia um arquivo CSV de uma string com ponto e vírgula como separador

O código a seguir mostra como ler um arquivo CSV de uma string (com ponto e vírgula como separadores) em um DataFrame do pandas:

 import pandas as pd
import io   

some_string="""team;points;rebounds
A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv ( io.StringIO (some_string), sep=" ; ")

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

O DataFrame do pandas resultante contém os valores da string CSV.

Exemplo 3: Ler um arquivo CSV de uma string sem cabeçalho

O código a seguir mostra como ler um arquivo CSV de uma string (sem uma linha de cabeçalho) em um DataFrame do pandas:

 import pandas as pd
import io   

some_string="""A;22;10
B;14;9
C;29;6
D;30;2
E;22;9
F;31;10"""

#read CSV string into pandas DataFrame
df = pd. read_csv (io. StringIO (some_string), sep=" ; ", header= None )

#view resulting DataFrame
print (df)

   0 1 2
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Usando o argumento header=None , dissemos aos pandas para não usarem a primeira linha como linha de cabeçalho.

Por padrão, o pandas usa um intervalo de valores numéricos (0, 1, 2) como nomes de colunas para o DataFrame.

Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:

Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: Como ler um arquivo CSV sem cabeçalho
Pandas: defina nomes de colunas ao importar um arquivo CSV

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *