Como criar um pandas dataframe a partir de uma string
Você pode usar a seguinte sintaxe básica para criar um DataFrame do pandas a partir de uma string:
import pandas as pd import io df = pd. read_csv ( io.StringIO (string_data), sep=" , ")
Esta sintaxe específica cria um DataFrame do pandas usando os valores contidos na string chamada string_data .
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: Crie um DataFrame a partir de uma String com Separadores de Vírgula
O código a seguir mostra como criar um DataFrame do pandas a partir de uma string na qual os valores da string são separados por vírgulas:
import pandas as pd import io #define string string_data="""points, assists, rebounds 5, 15, 22 7, 12, 9 4, 3, 18 2, 5, 10 3, 11, 5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" , ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
O resultado é um DataFrame do pandas com cinco linhas e três colunas.
Exemplo 2: Crie um DataFrame a partir de uma String com Separadores de Ponto e Vírgula
O código a seguir mostra como criar um DataFrame do pandas a partir de uma string na qual os valores da string são separados por ponto e vírgula:
import pandas as pd import io #define string string_data="""points;assists;rebounds 5;15;22 7;12;9 4;3;18 2;5;10 3;11;5 """ #create pandas DataFrame from string df = pd. read_csv ( io.StringIO (string_data), sep=" ; ") #view DataFrame print (df) points assists rebounds 0 5 15 22 1 7 12 9 2 4 3 18 3 2 5 10 4 3 11 5
O resultado é um DataFrame do pandas com cinco linhas e três colunas.
Se você tiver uma string com um separador diferente, simplesmente use o argumento sep na função read_csv() para especificar o separador.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Como converter colunas Pandas DataFrame em strings
Como converter carimbo de data/hora em data/hora no Pandas
Como converter DateTime em data no Pandas