Como criar um pandas dataframe a partir de uma string


Você pode usar a seguinte sintaxe básica para criar um DataFrame do pandas a partir de uma string:

 import pandas as pd
import io   

df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

Esta sintaxe específica cria um DataFrame do pandas usando os valores contidos na string chamada string_data .

Os exemplos a seguir mostram como usar essa sintaxe na prática.

Exemplo 1: Crie um DataFrame a partir de uma String com Separadores de Vírgula

O código a seguir mostra como criar um DataFrame do pandas a partir de uma string na qual os valores da string são separados por vírgulas:

 import pandas as pd
import io

#define string
string_data="""points, assists, rebounds
5, 15, 22
7, 12, 9
4, 3, 18
2, 5, 10
3, 11, 5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" , ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

O resultado é um DataFrame do pandas com cinco linhas e três colunas.

Exemplo 2: Crie um DataFrame a partir de uma String com Separadores de Ponto e Vírgula

O código a seguir mostra como criar um DataFrame do pandas a partir de uma string na qual os valores da string são separados por ponto e vírgula:

 import pandas as pd
import io

#define string
string_data="""points;assists;rebounds
5;15;22
7;12;9
4;3;18
2;5;10
3;11;5
"""

#create pandas DataFrame from string
df = pd. read_csv ( io.StringIO (string_data), sep=" ; ")

#view DataFrame
print (df)

   points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5

O resultado é um DataFrame do pandas com cinco linhas e três colunas.

Se você tiver uma string com um separador diferente, simplesmente use o argumento sep na função read_csv() para especificar o separador.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Como converter colunas Pandas DataFrame em strings
Como converter carimbo de data/hora em data/hora no Pandas
Como converter DateTime em data no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *